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(57) Abstract 

The invention concerns recombinant vectors replicated in mycobacteria, a set of sequences coding for exported polypeptides detected 
by fusion with alkaline phosphatase, in particular one polypeptide, called DP428, of about 12 kD corresponding to an exported protein found 
in mycobacteria belonging to the Mycobacterium tuberculosis complex. Trie invention also concerns methods and kits for detecting in vitro 
the presence of a mycobacterium and in particular a mycobacterium belonging to the Mycobacterium tuberculosis complex in a biological 
sample using said polypeptides, their fragments or polynucleotides coding for the latter. The invention also concerns immunogenic or 
vaccine compositions for preventing and/or treating infections caused by mycobacteria and in particular a mycobacterium belonging to said 
complex, particularly tuberculosis. 

(57) AbregS 

L'invention a pour objet des vecteurs recombinants se replicant chez les myco.b.actcnes, un ensemble de sequences codant pour 
des polypeptides exported ddtectes par des fusions avec la phosphatase alcalinc, notamment'un polypeptide, denomme* DP428, d'environ 
12kD correspondant a une proteTne exportee retrouvee dans les raycobacteries appartenant au complexe de "Mycobacterium tuberculosis. 
L'invention concerne egalement des process et des kits de detection in vitro de la presence d'une mycobacterie et en particulier une 
mycobacterie appartenant au complexe de Mycobacterium tuberculosis dans un echantillon biologique utilisant lesdits polypeptides, leurs 
fragments ou des polynucleotides codant pour ces demiers. L'invention vise des compositions immunogenes ou vaccins pour la prevention 
et/ou le traitement defections provoquees par des mycobactenes et en particulier une mycobacterie appartenant audit complexe, en 
particulier la tuberculose. 
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Sequences nucleiques de polypeptides exportes de 
mycobacteries, vecteurs les comprenant et applications au 
diagnostic et a la prevention de la tuberculose. 

5 L f invention a pour objet de nouveaux vecteurs 

recombinants de criblage, de clonage et/ou d 1 expression se 
repliquant chez les mycobacteries. Elle a egalement pour 
objet un ensemble de sequences codant pour des polypeptides 
exported detectes par des fusions avec la phosphatase 

10 alcaline et dont 1 'expression est regul6e (induite ou 
reprimSe) ou constitutive lors de 1' ingestion des 
mycobacteries par les macrophages. L' invention concerne 
egalement un polypeptide, denomme DP428, d 1 environ 12kD 
correspondant a une proteine exportee retrouvee dans les 

15 mycobacteries appartenant au complexe de Mycobacterium 
tuberculosis. L' invention vise aussi un polynucleotide 
comprenant une sequence codant pour ce polypeptide. Elle 
concerne egalement 1 ' utilisation du polypeptide ou de 
fragments de celui-ci et des polynucleotides codant pour 

20 ces derniers (ou encore les polynucleotides complementaires 
a ces derniers) pour la realisation de moyens de detection 
in vitro, ou in vivo de la presence d'une mycobacterie 
appartenant au complexe de Mycobacterium tuberculosis dans 
un echantillon biologique ou pour la detection de reactions 

25 de l'hote infecte par ces especes bactSriennes . L' invention 
vise enfin 1 ■ utilisation du polypeptide ou de fragments de 
celui-ci ainsi que des polynucleotides codant pour ces 
derniers en tant que moyens destines a la preparation d'une 
composition immunogene, susceptible d'induire une reponse 

30 immunitaire dirigee contre les mycobacteries appartenant au 
complexe de Mycobacterium tuberculosis, ou d'une 
composition vaccinale pour la prevention et/ou le 
traitement d' infections provoquees par des mycobacteries 
appartenant audit complexe, en particulier la tuberculose. 

35 
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La pr£sente invention a aussi pour but d'utiliser ces 
sequences (polypeptidiques et polynucl£otidiques) comme 
5 cible pour la recherche de nouveaux inhibiteurs de la 
croissance et de la multiplication des mycobact^ries et de 
leur maintien chez l'hote, ses inhibiteurs pouvant servir 
d » antibiotiques . 

10 Le genre Mycobacterium, qui comprend au moins 56 

especes diff£rentes, inclut des pathogenes humains majeurs 
tels que M. leprae et M. tuberculosis, les agents 
responsables de la lepre et de la tuberculose, qui restent 
des problemes graves de sante publique dans le monde 

15 entier. 



La tuberculose continue d'etre un probldme de santS 
publique dans le monde. Aujourd'hui, cette maladie est la 
cause de 2 a 3 millions de morts dans le monde et environ 8 

20 millions de nouveaux cas sont observes chaque ann£e 
(Bouvet, 1994). Dans les pays developpes M. tuberculosis 
est la cause la plus commune des infections 
mycobacteriennes . En France il apparait environ 10 000 
nouveaux cas par an et parmi les maladies a declaration 

25 obligatoire c'est la tuberculose qui comprend le plus grand 
nombre de cas. La vaccination par le BCG (Bacille de 
Calmette et Gu§rin) , une souche avirulente deriv§e de M. 
bovis et qui est trks utilisSe comme vaccin centre la 
tuberculose, est loin d'etre efficace au sein de toutes les 

30 populations. Cette efficacite varie environ de 80 % dans 
les pays occidentaux comme 1 « Angleterre, £ 0 % en Inde 
(resultats du dernier essai de vaccination a Chingleput . , 
publies en 1972 dans Indian J. Med. Res.). De plus, 
1' apparition de souches de M> tuberculosis resistantes aux 

35 antituberculeux et le risque accru chez les patients 
immunodSprimSs, patients atteints du SIDA, de developper 
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une tuberculose, rendent necessaire la mise au point de 
mSthodes rapides, specifiques et fiables pour le diagnostic 
de la tuberculose et la mise au point de nouveaux vaccins. 
Par exemple, une 6tude epidemiologique realisee en Floride, 

5 et dont les rdsultats ont ete publies en 1993 dans AIDS 
therapies, a montre que 10 % des malades atteints de SIDA 
sont atteints de tuberculose au moment du diagnostic du 
SIDA ou 18 mois avant celui-ci. Chez ces malades, la 
tuberculose apparait dans 60 % des cas sous une forme 

o disseminSe done non reperable par les criteres de 
diagnostic classiques comme la radiographie pulmonaire ou 
1* analyse de crachats. 



15 



Actuellement, une certitude sur le diagnostic apporte 
par la mise en evidence de bacilles cultivables dans un 
prelevement provenant du malade n'est obtenue que pour 
moins de la moitie des cas de tuberculose, meme dans les 
cas de tuberculose pulmonaire. Le diagnostic de la 
tuberculose et des autres mycobacteries apparentees est 
20 done difficile a realiser, et cela pour differences 
raisons : les mycobacteries sont souvent presences en 
faible quantite, leur temps de generation est tres long 
(24h pour M. tuberculosis) et leur culture est difficile. 
(Bates et al. , 1986) . 



25 



30 



35 



D' autres techniques sont utilisables en clinique, pour 
identifier une infection mycobacterienne : 

a) L' identification directe des microorganismes au 
microscope ; cette technique est rapide, mais ne permet pas 
1' identification de l'espece mycobactirienne observee et 
manque de sensibilite (Bates, 1979) . 

Les cultures, lorsqu'elles sont positives, ont une 
specif icite approchant 100 % et permettent 1 ' identification 
de^ l'espece mycobacterienne isolee ; neanmoins, comme 
precis^ ci-dessus, la croissance des mycobacteries in vitro 
est longue (ne peut etre realis6e qu'en 3 a 6 semaines de 
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cultures r6p6t6es (Bates, 1979 ; Bates et al., 1986)) et 
coQteuse. 

b) Les techniques s6rologiques peuvent s'av^rer utiles 
5 dans certaines conditions, mais leur utilisation est 
parfois limitSe par leur sensibilite et/ou leur specificity 
faibles (Daniel et al., 1987). 



1(1 



c) La presence de mycobacteries au sein d'un 
echantillon biologique peut aussi etre determinee par 
hybridation moieculaire avec de l'ADN ou de 1'ARN en 
utilisant des sondes d 1 oligonucleotides specif iques des 
sequences recherchSes (Kiehn et al . , 1987 ; Roberts et al., 
1987 ; Drake et al., 1987). Plusieurs etudes ont montre 
15 1« intent de cette technique pour le diagnostic des 
infections a mycobacteries . Les sondes utilisees sont 
constitutes d ' ADN , d'ARN ribosomique ou de fragments d'ADN 
mycobacteriens provenant de banque de genes. Le principe de 
ces techniques repose sur le polymorphisme des sequences 
20 nucliotidiques des fragments utilises ou sur le 
polymorphisme des regions avoisinantes . Dans tous les cas, 
elles necessitent 1 'utilisation de cultures et ne sont pas 
applicables directement sur les echantillons biologiques. 



25 



30 



35 



La faible quantite de mycobacteries presentes au sein 
d'un echantillon biologique et en consequence la quantity 
faible d'ADN cible a dStecter dans cet echantillon peut 
nScessiter le recours a une amplification sp^cifique in 
vitro de l'ADN cible avant sa detection a l'aide de la 
sonde nucleotidique et en utilisant des techniques 
d' amplification in vitro telles que la PCR (amplification 
en chaine a la polymerase. L ' amplification specif ique de 
l'ADN par la technique PCR peut constituer la premi&re 
etape d'un proc£d£ de detection de la presence d'un ADN 
mycobacterien dans un echantillon biologique, la detection 
proprement. dite de l'ADN amplifie etant effectuee dans un 
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second temps a l'aide d'une sonde oligonucleotidique 
capable de s'hybrider specif iquement a l'ADN amplifie. 

Un test de detection de mycobactSries appartenant au 
complexe de Mycobacterium tuberculosis, par hybridation 
sandwich (test utilisant une sonde de capture et une sonde 
de detection) a ete decrit par Chevrier et al. en 1993. le 
complexe de Mycobacterium tuberculosis est un groupe de 
raycobacteries qui comprend M. bovis-BCG, M. bovis, M. 
tuberculosis, M. africanum et M. microti. 

Un procede de detection de faibles quantites de 
mycobacteries, appartenant au complexe tuberculosis, par 
amplification genique et hybridation directement sur des 
echantillons biologiques a ete mis au point. Ledit procede 
utilise la sequence d' insertion IS6110 (Brevet europeen EP 
0 490 951 Bl) . Thierry et al. ont decrit en 1990 une 
sequence specifique du complexe Mycobacterium tuberculosis 
et nommee IS 6110. Certains auteurs ont propose 
-d 'amplifier specif iquement l'ADN provenant de 
Mycobacterium en utilisant des amorces nucleiques dans une 
methode d' amplification, telle que la reaction de 
polymerase en chaine (PCR) . Patel et al. ont decrit en 1990 
1' utilisation de plusieurs amorces nucleiques choisies a 
partir d'une. sequence connue en tant que sonde dans 
1' identification de M. tuberculosis. Cependant, la longueur 
des fragments obtenus en utilisant ces amorces etait 
differente de la longueur theorique attendue et plusieurs 
fragments de taille variable etaient obtenus. De plus, les 
auteurs ont observS 1' absence d' hybridation des produits 
amplifies avec le plasmide ayant servi a determiner les 
amorces. Ces resultats indiquent que ces amorces ne 
seraient pas appropriees dans la detection de la presence 
de M. tuberculosis dans un echantillon biologique et 
confirment la nature critique du choix des amorces. La meme 
annee, J..L. Guesdon et D. Thierry ont decrit une methode de 
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detection de M. tuberculosis, de grande sensibility, par 

amplification d'un fragment d'ADN de M. tuberculosis 

localise au sein de la sequence IS6110 (Brevet europeen EP 
461 04 5) 3 l'aide d' amorces g£n£rant des fragments d'ADN 

5 amplifie de longueur constante, meme lorsque le choix des 
amorces conduisait a 1 ' amplification de fragments longs (de 
I'ordre de 1000 & 1500 bases) oti le risque d' interruption 
de la polymerisation est eiev£e en raison des effets de la 
structure secondaire de la sequence. D'autres amorces 

10 sp£cifiques de la sequence IS6110 sont d^crites dans le 
brevet europeen N° EP-0490 951, 

Les inventeurs ont montre (resultats non publics) que 
certains isolats cliniques de Mycobacterium tuberculosis 

15 etaient exempts de la sequence d' insertion IS6110 et ne 
pouvaient done etre detectes a l'aide des oligonucleotides 
specifiques de cette sequence pouvant conduire ainsi a des 
resultats de diagnostic faussement negatifs. Ces resultats 
confirment une observation similaire faite par Yuen et al- 

20 en 1993. L* impossibility de detecter ces souches pathogenes 
poteritiellement presentes dans un echantillon biologique 
preleve sur un patient est ainsi susceptible de conduire k 
des difficulties voire des erreurs de diagnostic. La 
disponibilite de plusieurs sequences spScifiques du Bacille 

25 de la tuberculose, k l'intSrieur desquelles des amorces 
appropri^es pour 1 1 amplification seront choisis, est 
importante. La sequence DP428 decrite ici pourra etre 
utilisee. 

3() M- bovis et M. tuberculosis, les agents causals de la 

tuberculose, sont des bact6ries facultatives intra - 
cellulaires. 



Ces agents ont d6velopp6 des mecanismes pour assurer 
35 leur survie et leur replication a l'interieur du 
macrophage, un des types cellulaires qui est suppose 



WO 99/09186 



7FR98/01813 



7 



10 



15 



Sradiquer 1' invasion par des microorganismes . Ces agents 
sont capables de moduler 1' evolution normale de leur 
phagosome et de les empgcher de se diff£rencier en un 
compart iment acide riche en hydrolase (Clemens, 1979 ; 
Clemens et al., 1996; Sturgill-Koszycki et al . , 1994 et Xu 
et al., 1994). Cependant, cette modulation n f est possible 
que si la bactSrie est vivante au sein du phagosome, 
suggSrant que des composes synth6tis<§s de maniere active 
et/ou s£cr£t<§s a 1'intSrieur de la cellule font partie de 
ce mecanisme. Des proteines exportees sont probablement 
impliquees dans ce mecanisme. En depit des problemes 
majeurs de sant£ lies a ces organismes pathogenes, on sait 
peu de choses sur leurs prolines exportees et/ou 
s£cretees. Des analyses en SDS-PAGE de filtrat de culture 
de M. tuberculosis montrent au moins 30 proteines secretSes 
(Altschul et al., 1990 ; Nagal et al . , 1991 et Young et 
al., 1992). Certaines d'entre elles ont ete caract6ris6es, 

leurs 9^ n ^s clones et sequences (Borremans et al., 1989 ; 

Wiker et al . , 1992 et Yamaguchi et al., 1989). D'autres, 
20 bien qu'il s'agisse d'antigenes immunodominants 
d' importance majeure pour induire une immunite protectrice 
(Anderson et al.,1991 et Orme et al . , 1993), ne sont pas 
totalement identifies. En outre, il est probable que de 
nombreuses prolines exportees restent fixees sur la 
25 membrane cellulaire et par consequent ne soient pas 
presentes dans les surnageants de culture. II a <§t6 montre 
que les proteines localises a la surface externe de 
diverses bacteries pathogenes, telles que l'invasine de 103 
kDa de Yersina Pseudotuberculosis (Isberg et al., 1987) ou 
30 l'internaline de 80 kDa de Listeria monocytogenes (Gaillard 
et al., 1991 et Dramsi et al . , 1997) jouent un role 
important dans les interactions avec les cellules hotes et 
par consequent, dans la pathogenicity comme dans 
1' induction de reponses protectrices . Ainsi, une proteine 
35 li§ e £ la membrane pourrait §tre importante pour 
1' infection a M. tuberculosis comme pour 1' induction de 
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rSponse protectrice contre cette infection. Ces prolines 
pourraient revetir un int£r§t certain pour la pr6paration 
de vaccins. 

5 RScemment, il a 6t£ d§crit l 1 adaptation aux 

mycobacterias d'une mSthodologie g£n£tique pour 
1 1 identification et la selection ph^notypique de protSines 
exportSes (Lim et al. f 1995). Cette mSthode utilise la 
phosphatase alkaline (PhoA) p£riplasmique d*E. coli. Un 

10 vecteur plasmidique a 6t6 construit permettant la fusion de 
genes entre un gene PhoA tronquS et des genes codant pour 
des proteines exportSes (Manoil et al., 1990). 

Par cette mSthode, il a pu etre identifi£ un gene 
15 de M. tuberculosis (erp (Berthet et al., 1995)) presentant 
des homologies avec une prot6ine export<§e de 28 kDa de M. 
leprae, qui est une cible frequente des rSponses humorales 
de la forme lepromateuse de la ISpre. Une proteine 
presentant des motifs aminoacides caracteristiques de la 
20 desaturase de plante (des) a aussi £te caract6ris6e par la 
technique de fusion avec PhoA. 

Cependant, cette methode gen£tique d' identification 
de prolines exportees ne permet pas d'Svaluer facilement 

25 1« expression intracellulaire des g§nes correspondants . Une 
telle Evaluation est d'une importance primordiale a la fois 
pour la selection de bons candidats vaccins et pour la 
comprehension des interactions entre les bact£ries et leurs 
cellules hotes, L« induction de 1' expression de facteur de 

30 virulence par contact de cellule cible pathogdne a et£ 
decrite. C'est le cas par exemple pour les facteurs de 
virulence Yops (Petersson et al., 1996) de Yersinia 
pseudotuberculosis. Shigella par contact avec les cellules 
cibles relargue les proteines Ipa dans le milieu de 

35 culture, .et Salmonella synth§tise de nouvelles structures 
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de surface . 

Compte tenu de ce qui precede, il existe aujourd'hui 
un grand besoin de developper de nouveaux vaccins contre 

5 les mycobacterias pathogenes ainsi que de nouveaux tests de 
diagnostic specifiques, fiables et rapides. Ces 
d§veloppements necessitent la mise au point d'outils 
sp6cifiques encore plus performants permettant, d'une part, 
d'isoler ou d'obtenir des sequences de nouveaux 

10 polypeptides specifiques, notamment immunogenes, et, 
d' autre part, de mieux comprendre le m6canisme des 
interactions entre les bacteries et leurs cellules hStes 
comme notamment 1' induction de 1' expression de facteur de 
virulence . Ceci est precisement l'objet de la presente 

15 invention. 

Les inventeurs ont defini et realise dans ce but de 
nouveaux vecteurs permettant le criblage, le clonage et/ou 
1 'expression de sequences d'ADN de mycobacteries afin 

2(> d' identifier parmi ces sequences, des acides nucleiques 
codant pour des proteines d'interet, de preference des 
proteines exportees, pouvant etre local isees sur la 
membrane bacterienne et/ou s6cretees, et d' identifier parmi 
ces sequences celles qui sont induites ou reprimees lors de 

2S 1' infection (croissance intracellulaire) . 

Description 

La presente invention decrit 1 'utilisation du gene 
30 rapporteur phoA chez les mycobacteries. II permet 
d' identifier des systemes d'expression et d' exportation 
dans un contexte mycobacterien. Beaucoup de genes ne sont 
exprimes que dans un tel contexte, ce qui montre l'avantage 
de la presente invention. Au cours du clonage de segments 
35 d'ADN de souches du complexe M. Tuberculosis en fusion avec 
phoA dansune autre mycobacterie comme W. smegroatis, le 
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debut du gene, ses regions regulatrices et son regulateur 
seront clones ce qui permettra d' observer une regulation. 
Si cette regulation est positive, le clonage du regulateur 
constituera un avantage pour observer 1' expression et 
5 1 'exportation. 

Dans le contexte de 1' invention, on entend par 
mycobactSrie toutes les mycobacteries appartenant aux 
di verses espSces enumerees par Wayne L. G. and Kubica G. P. 
(1980). Family Mycobacteriaceae in Bergey's manual of 
systematic bacteriology, J. P. Butler Ed. (Baltimore USA : 
Williams et Wilkins P. 1436-1457) . 



to 



15 



20 



25 



30 



35 



Dans certains cas les gSnes clones sont soumis dans 
leur hote d'origine § une regulation negative rendant 
1' observation de 1' expression et de 1 'exportation difficile 
chez 1'hote d'origine. Dans ce cas, le clonage du gene en 
absence de son regulateur negatif, dans un hote ne le 
contenant pas, constituera un avantage. 

L 1 invention vise aussi de nouveaux polypeptides et de 
nouveaux polynucleotides de mycobacteries ayant pu etre 
isoies au moyen des vecteurs precedents et susceptibles 
d'entrer dans la realisation de compositions pour la 
detection d'une infection par des mycobacteries, ou pour la 
protection contre une infection due a des mycobateries ou 
pour la recherche d' inhibiteurs comme cela est deer it 
precedemment pour DP428. 



L 1 invention a done pour objet un vecteur recombinant 
de criblage, de clonage et/ou d' express ion, caracterise en 
ce qu'il se replique chez des mycobacteries et en ce qu'il 
contient : 

1) un replicon fonctionnel chez les mycobacteries ; 

2) un marqueur de selection ; 
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3) une cassette rapporteur comprenant : 

a) un site de clonage multiple (polylinker) , 

b) eventuellement un terminateur de transcription 
actif chez les mycobact£ries, en amont du polylinker, 

c) uhe sequence nuclgotidique codante issue d'un gdne 
codant pour un marqueur d'expression, d'exportation et/ou 
de secretion de protSine, ladite sequence nuclSotidique 
Stant depourvue de son codon d' initiation et de ses 
sequences de regulation, et 

d) une sequence nucl£otidique codante issue d'un g£ne 
codant pour un marqueur d'activite de promoteurs contenus 
dans le m§me fragment, ladite sequence nucleotidique Stant 
pourvue de son codon d' initiation . Eventuellement, le 

15 yecteur recombinant contient egalement un replicon 
fonctionnel chez E. coli. 

De maniere pref<Sr«5e, le marqueur d 4 exportation et/ou 
de sdcrStion est place dans la meme orientation que le 
marqueur d'activite de promoteurs. 



2() 



PrSferentiellement, le vecteur recombinant de criblage 
selon 1' invention comprendra, en outre, un terminateur de 
transcription place en aval du marqueur d'activite de 
promoteurs, ce qui est de nature a permettre l'obtention de 
transcrits courts qui se relent plus stables et qui, par 
consequent, permettent un plus haut niveau d'expression des 
produits de traduction. 

Le marqueur d- exportation et/ou de secretion est une 
sequence de nucleotides dont l' expression suivie de 
1' exportation et/ou de la secretion depend des elements de 
regulation qui contr61ent son expression. 

35 Par "sequences ou Elements de regulation de 

1' expression de la production de polypeptides et de sa 
localisation", on entend une sequence promotrice de la 
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transcription, une sequence comprenant le site de liaison 
au ribosome (RBS) , les sequences responsables de 
1" exportation et/ou la secretion telles que la sequence 
dite sequence signal . 

5 

Un premier marqueur interessant d 1 exportation et/ou 
d» expression est une sequence codante issue du gene phoA. 
Le cas 6ch£ant, elle est tronqu£e de telle fagon que 
l'activite phosphatase alcaline est cependant susceptible 
10 d'etre restauree lorsque la sequence codante tronquSe est 
placSe sous le controle d'un promoteur et d' elements de 
regulation appropries. 

D'autres marqueurs d' exposition, d 1 exportation et/ou 
15 de secretion peuvent etre utilises. On citera a titre 
d'exemples une sequence du g£ne p-agarase, de la nuclease 
d'un staphylocoque ou d'une P- lactamase. 

Parmi les marqueurs intSressants d»activite de 
20 promoteurs contenus dans le meme fragment, on prefere une 
sequence codante issue du g&ne luc de luciferase de luciole 
pourvue de son codon d" initiation. 

D'autres marqueurs d'activite de promoteurs contenus 
25 dans-le m§me fragment peuvent Stre utilises. On citera a 
titre d'exemples une sequence du gene de la GFP (Green 
Fluorescent Protein) . 

Le terminateur de transcription doit §tre fonctionnel 
30 chez les mycobacteries . Un terminateur avantageux est a cet 
egard le terminateur du coliphage T4 (tT4) . D'autres 
terminateurs appropries pour la realisation de 1' invention 
peuvent etre isoies en utilisant la technique presentee 
dans les exemples, par exemple au moyen d'une cassette 
35 "omega" (Prentki et al., 1984). 
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Un vecteur particuliSrement prefere pour la 
realisation de 1' invention est un plasmide choisi parmi les 
plasmides suivants deposes a la CNCM (Collection Nationale 
de Cultures de Microorganismes, 25 rue de Docteur Roux, 
5 75724 Paris cedex 15, France) : 

a) pJVEDa depose a la CNCM sous le N° 1-1797, le 12/12 

1996, 

b) pJVEDb depos6 a la CNCM sous le N° 1-1906, le 25 
10 juillet 1997, 

c) pJVEDc depose a la CNCM sous le N° 1-1799 , le 
12/12 1996. 



15 



20 
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35 



Pour la selection, ou 1 ' identification de sequences 
d'acides nucieiques de mycobacteries codant pour des 
polypeptides susceptibles d'etre incorpores dans des 
compositions immunogenes, ou antigeniques pour la detection 
d'une infection, ou susceptibles d'induire ou de reprimer 
un facteur de virulence de mycobacteries, le vecteur de 
1' invention comprendra, en l'un des sites de clonage 
multiple du polylinker, une sequence de nucleotides d'une 
mycobacterie chez laquelle on detecte la presence de 
sequences correspondant a des polypeptides exportes et/ou 
secretes pouvant etre induits ou reprints lors de 
1' infection, ou encore exprimes ou produits de facon 
constitutive, " leurs sequences promotrices et/ou 
regulatrices associees susceptibles de permettre ou de 
favoriser 1 ' exportation et/ou la secretion desdits 
polypeptides d'int&rfit. ou tout ou partie de genes 
d'interet codant pour lesdits polypeptides. 

De preference, cette sequence est obtenue par 
fragmentation physique ou par digestion enzymatique de 
l'ADN genomique ou de 1-ADN compiementaire d'un ARN d'une 
mycobacterie, de preference M. tuberculosis ou choisie 
parmi M. africanum, M. bovis, M. avium ou W. leprae. 
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Les vecteurs de 1' invention peuvent en effet egalement 
§tre utilises pour determiner la presence de sequences 
d'interet, de preference correspondant a des proteines 
exportees et/ou secretees, et/ou capables d'etre induites 
ou reprimees ou produites de facon constitutive lors de 
1' infection, notamment lors de la phagocytose par les 
macrophages, et selon ce qui a ete expose precedemment, 
chez des mycobacteries telles que M. africanum, M. bovis, 
M. avium ou M. leprae dont on aura traite l'ADN ou l'ADNc 
par fragmentation physique ou avec des enzymes determinees. 

Selon un premier mode de realisation de 1' invention la 
digestion enzymatique de l'ADN genomique ou de l'ADN 
complementaire est effectuee a partir de M. tuberculosis. 

De preference cet ADN est digere avec une enzyme telle 
que sau3A, BclI.Bglll. 



D'autres enzymes de digestion telles que Seal, Apal, 
SacII, Kpnl ou encore des nucleases ou des polymerases, 
peuvent naturellement etre mises en oeuvre, des lors 
qu'elles permettent 1'obtention de fragments dont les 
extremites peuvent etre inserees dans l'un des sites de 
clonage du polylinker du vecteur de 1' invention. 

Le cas echeant, des digestions avec differentes 
25 enzymes seront- effectuees simultanement . 

Des vecteurs recombinants preferes pour la realisation 
de 1' invention sont choisis parmi les vecteurs recombinants 
suivants deposes a la CNCM : 

30 a) P 6D7 depose le 28 janvier 1997 a la CNCM sous le N°I- 
1814, 

b) P 5A3 depose le 28 janvier 1997 a la CNCM sous le N°I- 
1815, 

c) p5F6 depose le 28 janvier 1997 a la CNCM sous le N°I- 
35 1816, 

d) p2A29 depose le 28 janvier 1997 a la. CNCM sous le N°I- 
1817, 
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e) pDP428 d§pos6 le 28 janvier 1997 a la CNCM sous le N°I- 
1818, 

f) p5B5 depose le 28 janvier 1997 a la CNCM sous le N°l- 
5 1819, 

g) plC7 depos<§ le 28 janvier 1997 a la CNCM sous le N°I- 
1820, 

h) p2D7 deposS le 28 janvier 1997 a la CNCM sous le N°I- 
1821, 

10 i) plB7 depose le 31 janvier 1997 a la CNCM sous le N°I- 
1843, 

j) pJVED/AT. tuberculosis depose le 25 juillet 1997 a la 

CNCM sous le N° 1-1907, 
k) pM!C25 d6pose le 4 aodt 1998 a la CNCM sous le n°I-2062. 

15 

Parmi les plus prefSres, on prefdre le vecteur 
recombinant pDP428 depose le 28 janvier 1997 a la CNCM sous 
le N°I-1818, et le vecteur pMlC25 depose le 4 aout 1998 a 
la CNCM sous le N° 1-2062. 

20 

L T invention a egalement pour objet un proced§ de 
criblage de sequences de nucleotides issues de 
mycobacteries pour determiner la presence de sequences 
correspondant a des polypeptides exportes et/ou secretes 

25 pouvant etre induits ou reprimes lors de 1' infection, leurs 
sequences promotrices et/ou regulatrices associ6es 

susceptibles notamment de permettre ou de favoriser 
1' exportation et/ou la secretion desdits polypeptides 
d'intSr§t, ou tout ou partie de genes d'intSr§t codant pour 

30 lesdits polypeptides, caractSrise en ce qu'il met en oeuvre 
un vecteur recombinant selon 1' invention. 

L» invention concerne aussi un procedS de criblage, 
selon 1' invention, caracterisS en ce qu'il comprend les 
Stapes suivantes : 

35 

a) la fragmentation physique des sequences d'ADN de 
mycobacteries ou leur digestion par au moins une enzyme 
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determine et la recuperation des fragments obtenus ; 

b) 1 ! insertion des fragments obtenus £ l'etape a) dans 
un site de clonage, compatible le cas 6ch£ant avec V enzyme 
de l f 6tape a), du polylinker d'un vecteur selon 
l r invention ; 

c) si besoin, 1 ' amplification desdits fragments 
contenus dans le vecteur, par exemple par replication de ce 
dernier apres insertion du vecteur ainsi modifie dans une 
cellule d£termin£e, de preference E coli ; 

d) la transformation des cellules hotes par le vecteur 
amplifie a l'etape c) , ou en l'absence d'amplif ication, par 
le vecteur de l'etape b) ; 

e) la culture des cellules hotes transformees dans un 
milieu permettant la mise en evidence du marqueur 
d' exportation et/ou de secretion, et /ou du marqueur 
d'activite de promoteurs contenu dans le vecteur ; 

f) la detection des cellules hotes positives (colonies 
positives) pour 1' expression du marqueur d' exportation 
et/ou de secretion, et /ou du marqueur d'activite de 

20 promoteurs ; 

g) 1'isolement de l'ADN des colonies positives et 
1' insertion de cet ADN dans une cellule identique a celle 
de l'etape c) ; 

h) la selection des insertions contenues dans le 
vecteur, permettant l'obtention de clones positifs pour le 
marqueur d' exportation et/ou de secretion, et /ou pour le 
marqueur d'activite de promoteurs / 

i) 1'isolement et la caracterisation des fragments 
d'ADN de mycobacteries contenues dans ces inserats. 
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Dans l'un des modes de realisation prefers du procede 
de criblage selon 1- invention, les cellules h6tes 
positives, detectees a l'etape f ) , pour le marqueur 
d' exportation et/ou de secretion sont, eventuellement dans 
un second temps, testees pour la capacite de 1' insert 
nucleotidase seiectionne i stimuler 1< expression du 
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marqueur d' activity de promoteurs lorsque lesdites cellules 
hotes sont phagocytees par des cellules du type 
macrophagique . 

De maniere plus specifique, on compare la stimulation 
de 1' expression du marqueur d'activite de promoteurs chez 
des cellules h6tes placees en culture axenique (cellules 
hdtes seules en culture) a la stimulation de 1- expression 
du marqueur d'activite de promoteurs chez des cellules 
hotes cultiv6es en presence de macrophages et ainsi 
phagocytees par ces derniers. 

La selection de cellules hotes positives pour le 
marqueur d'activite de promoteurs peut etre realisee des 
l'etape e) du procede de criblage decrit ci-dessus, ou 
encore apres l'une quelconque des etapes f ) , g) , h) ou i) , 
c'est-a-dire une fois que les cellules h6tes ont ete 
selectionnees positivement pour le marqueur d' exportation 
et/ou de selection. 

La mise en oeuvre de ce procede permet la construction 
de banques d'ADN comportant des sequences correspondant S 
des polypeptides susceptibles d'etre exportes et/ou 
secretes, et/ou susceptibles d'etre induits ou reprimes 
lors de 1' infection lorsqu'ils sont produits au sein de 
mycobacteries • recombinantes. L'etape i) du procede peut 
comprendre une etape de sequengage des insertions 
selectionnees . 

De preference, dans le procede selon 1' invention, le 
vecteur utilise est choisi parmi les plasmides pJVEDa 
(CNCM, No 1-1797) .pJVEDb (CNCM, N<> 1-1906), pJVEDc (CNCM, 
N» 1-1799) ou pJVED/M. tuberculoBia (CNCM, N»I-1907) , et la 
digestion des sequences d'ADN de mycobacteries est 
effectuee au moyen de 1' enzyme Sau3A. 



Seloriun mode de realisation prefere de l'inventi 
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le procede de criblage est caract§rise en ce que les 
sequences de mycobacteries sont issues d'une mycobacterie 
pathogene, par exemple de M. tuberculosis, M. bovis, M. 
avium, M. africanum ou M. leprae. 

L 1 invention comprend egalement une banque d'ADN 
genomique ou d'ADNc compiementaire d ' ARNm de mycobacterie, 
caracterisee en ce qu'elle est obtenue par un procede 
comprenant les Stapes a)et b) , ou a), b) et c) du procede 
precedent selon 1' invention, de preference une banque d'ADN 
genomique ou d'ADNc compiementaire d 1 ARNm de mycobacteries 
pathogenes, de preference de mycobacteries appartenant au 
groupe du complexe Mycobacterium tuberculosis, de 
preference de Mycobacterium tuberculosis. 

Dans la presente invention, on entend designer par 
"sequences nucleiques" ou "sequences d'acides amines" SEQ 
ID N° X & SEQ ID N° Y, oil X et Y peuvent representer 
independamment un nombre ou un caractere alphanumerique, 
respectivement 1' ensemble des sequences nucleiques ou 
1' ensemble des sequences d'acides amines representees par 
les figures X a Y, extremites comprises. 

Par exemple, les sequences nucleiques ou les sequences 
25 d'acides amines SEQ ID N° la SEQ ID N° 4N sont 
respectivement les sequences nucleiques ou les sequences 
d'acides amines representees par les figures 1 a 4N, c'est- 
a-dire respectivement les sequences nucleiques ou les 
sequences d'acides amines SEQ ID N° 1, SEQ ID N* 1A', SEQ 
30 ID N° IB', SEQ ID N° 1C« , SEQ ID N° ID, SEQ ID N° IF, SEQ 
ID No 2, SEQ ID N° 3A, SEQ ID N* 3B, SEQ ID N<> 3C, SEQ ID 
No 4A, SEQ ID N° 4B, SEQ ID N° 4C, SEQ ID N<> 4A» , SEQ ID N* 
4B', SEQ ID N° 4C, SEQ ID N° 4F, SEQ ID N° 4J, SEQ ID N° 
4K, SEQ ID N° 4L, SEQ ID N° 4M et SEQ ID N° 4N. 



20 
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L 1 invention S egalement pour objet les sequences 
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nucleotidiques de mycobacteries ou comprenant des sequences 
nucleotidiques de mycobacteries selectionnees apres la 
realisation du procede selon 1' invention ci-dessus decrit. 



De preference, ladite mycobacterie est choisie parmi M. 
tuberculosis, M. bovis, M. africanum, M. avium, M. leprae, 
M. paratuberculosis, M. kansassi ou M. xenopi. 

On prefere les sequences nucl6otidiques de mycobacteries 
ou comprenant une sequence nucleotidique de mycobacterie, 
ladite sequence nucleotidique de mycobacterie etant choisie 
parmi les sequences de fragments d'ADN de mycobacterie de 
sequence nucleique SEQ ID N° 1 a SEQ ID N° 24C, SEQ ID N« 
27A a SEQ ID N° 27C, SEQ ID N° 29 et SEQ ID N° 31A a SEQ ID 
N» 50F, respect ivement representees par les figures 1 a 24C 
(planches 1 a 150), par les figures 27A a 27C (planches 152 
£ 154), par la figure 29 (planche 156) et par les figures 
31A 3 50F (planches 158 a 275) . 

Selon un mode de realisation particulier de 1' invention, 
des sequences preferees aont par exemple les fragments 
d'ADN de mycobacteries de sequence SEQ ID N"l, SEQ ID N°3A, 
SEQ ID N°5A, SEQ ID N°6A, SEQ ID N°7A, SEQ ID N°8A, SEQ ID 
N»9A, SEQ ID N°10A, SEQ ID N<>27A ou SEQ ID N»29 contenus 
respect ivement dans les vecteurs pDP428 (CNCM, 1^1-1818), 
P6D7 (CNCM, N'I-1814), p5F6 (CNCM, N'I-1816) , p2A29 (CNCM^ 
Noi-1817), P 5B5 (CNCM, N°I-1819) , P 1C7 (CNCM, N°I-1820) ! 
P2D7 <CNCM,N°I-1821), plB7 (CNCM, N°I-1843), p5A3 (CNCm! 
N«>l-1815) et pMlC25 (CNCM, n°I-2062) . 

L' invention concerne egalement un acide nucleique 
comprenant la totalite de la phase de lecture ouverte d'une 
des sequences nucleotidique s selon 1' invention, notamment 
une des sequences SEQ ID N° 1 a SEQ ID N° 24C, SEQ ID N° 
27A a SEQ ID N° 27C, SEQ ID N° 29 et SEQ ID N° 31A a SEQ ID 
N° 50F selon 1' invention. Ledit acide nucleique peut Stre 
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isolS par exemple de la facon suivante : 

a) preparation d'une banque de cosmides a partir de l'ADN 
de M. tuberculosis, par exemple selon la technique decrite 
par Jacobs et al., 1991; 

b) hybridation de tout ou partie d'un acide nucleique 
sonde de sequence choisie par exemple parmi SEQ ID N° 1 a 
SEQ ID N° 24C, SEQ ID N° 27A a SEQ ID N° 27C, SEQ ID N° 29 
et SEQ ID N° 31A a SEQ ID N° 50F avec les cosmides de la 
banque prealablement preparee a l'etape a) ; 

c) selection des cosmides hybridant avec 1' acide 
nucleique sonde de l'etape b) ; 

d) sequencage des inserts d'ADN des clones select ionnes a 
l'etape c) et identification du cadre de lecture ouvert 

15 complet ; 

e) le cas echeant, clonage des inserts sequences a 
l'etape d) dans un vecteur d' expression et/ou de clonage 
approprie . 



Les acides nucleiques comprenant la totalite du cadre de 
lecture ouvert des sequences SEQ ID N° 1 a SEQ ID N° 24C, 
SEQ ID N° 27A a SEQ ID N° 27C, SEQ ID N" 29 et SEQ ID N° 
31A a SEQ ID N° 50F sont parmi les acides nucleiques 
pr6f er6s . 

La presente invention permet de determiner un fragment 
de gene codant pour un polypeptide exporte. La comparison 
avec la sequence du genome publiee par Cole et al . (Cole et 
al., 1998, Nature, 393, 537-S44) permet de determiner le 
gene en entier portant la sequence identifiee selon la 
presente invention. 

Par sequence nucleotidique comprenant la totalite du 
cadre ouvert de lecture d'une sequence selon 1' invention, 
on entend la sequence nucleotidique (g6nomique, ADNc, semi- 
synthetique ou synthetique) comprenant l'une des sequences 
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selon 1' invention et s'etendant d'une part en 5 ' de ces 
sequences jusqu'au premier codon d' initiation de la 
traduction (ATG ou GTG) ou meme jusqu'au premier codon 
stop, et d» autre part en 3' de ces sequences jusqu'au codon 
5 stop suivant, et ceci dans l'une quelconque des trois 
phases de lecture possibles . 

Les sequences nucleotidiques complementaires des 
sequences ci-dessus selon 1' invention font egalement partie 
l» de 1 1 invention. 

Par polynucleotide de sequence complementaire d'une 

sequence nucleotidique selon 1' invention, on entend toute 

sequence d'ADN ou d'ARN dont les nucleotides sont 

IS complementaires de ceux de ladite sequence selon 
1' invention et dont 1 'orientation est inversSe. 

Les fragments nucleotidiques des sequences ci-dessus 
selon 1' invention notamment utiles en tant que sondes ou 
amorces font egalement partie de 1' invention. 

L« invention concerne aussi les polynucleotides 
caracterises en ce qu'ils comprennent un polynucleotide 
choisi parmi : 

a) un polynucleotide dont la sequence est complementaire de 
la sequence d'un polynucleotide selon 1' invention, 

b) un polynucleotide dont la sequence comporte au moins 50% 
d'identite avec un polynucleotide selon 1' invention, 

c) un polynucleotide hybridant dans des conditions de forte 
stringence avec une sequence de polynucleotide selon 
1 ' invention, 

d) un fragment d'au moins 8 nucleotides consecutifs d'un 
polynucleotide dSfini selon 1' invention. 

Les conditions de forte stringence ainsi que le 
pourcentage d'identite seront definis ci-apres dans la 
presente description. 
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Lorsque la sequence codante issue du gene marqueur 
d' exportation et/ou de secretion est une sequence issue du 
g&ne phoA, 1 ' exportation et/ou la secretion du produit du 

5 g£ne phoA, le cas 6ch6ant tronque, n'est obtenue que 
lorsque cette sequence est ins^rSe en phase avec la 
sequence ou element de regulation de 1' expression de la 
production de polynucleotides et sa localisation placSe en 
amont, qui contient les elements controlant 1 ■ expression, 

10 1' exportation et/ou la secretion issus de sequence de 
mycobacteries. 



Les vecteurs recombinants de 1' invention peuvent bien 
entendu comprendre des sites de clonage multiples decalSs 
de un ou deux nucleotides par rapport a un vecteur selon 
1' invention, permettant ainsi d'exprimer le polypeptide 
correspondant au fragment d'ADN de mycobactgrie insure et 
susceptible d'etre traduit selon l'un des trois cadres de 
lecture possibles. 



Par exemple les vecteurs pr§feres pJVEDb et pJVEDc de 
l 1 invention se distinguent du vecteur prefgre pJVEDa par un 
d6calage respectif de un et de deux nucleotides au niveau 
25 du site de clonage multiple. 

Ainsi, les vecteurs de 1« invention sont capables 
d'exprimer chacun des polypeptides susceptibles d'etre 
codes par un fragment d'ADN de mycobacterie insere. Cesdits 
30 polypeptides, caracterises en ce qu'ils sont done 
susceptibles d'etre exportes et/ou secretes, et/ou induits 
ou reprices, ou exprimes de fa<?on constitutive lors de 
1' infection, font partie de 1' invention. 



35 



On prefSre notamment les polypeptides de 1' invention 
dont les sequences d'acides amines sont choisies parmi les 
sequences d'acides amines SEQ ID N° 1 a SEQ ID N° 24C, SEQ 
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ID N° 27A a SEQ ID N° 28 et SEQ ID N° 30 a SEQ ID N° 50F et 
representees respectivement par les figures 1 a 24C 
(planches 1 a 150) , les figures 27A a 28 (planches 152 a 
155) et les figures 30 a 50F (planches 157 a 275) . 

5 

Font egalement partie de 1' invention, les fragments ou 
fragments biologiquement actifs ainsi que les polypeptides 
homologues desdits polypeptides. Fragment, fragment 
biologiquement actif et polypeptides homologue de 
10 polypeptide, etant tels que dSfinis ci-apres dans la 
description. 

L' invention concerne £galement les polypeptides 
comprenant un polypeptide ou un de leurs fragments selon 
15 l r invention. 

L 1 invention a aussi pour objet des mycobacteries 
recombinantes contenant . un vecteur recombinant selon 
"l 1 invention decrit precedemment . Une mycobacterie pr^f^ree 
20 est une mycobacterie du type M. smegma tis. 

M. smeqmatis permet avantageusement de tester 
l'efficacite de sequences de mycobacteries, pour le 
controle de 1 1 expression, de 1 » exportation et/ou de la 
secretion, et/ou de l'activite de promoteurs d'une sequence 
25 donnSe, par exemple d'une sequence codant pour un marqueur 
tel que la phosphatase alcaline et/ou la lucif erase. 

Une autre mycobacterie pr6f£r£e est une mycobacterie du 
type M. bovis, par exemple la souche BCG utilisee 
30 actuellement pour la vaccination contre la tuberculose. 

Une autre mycobacterie pr£fer£e est une souche de M. 
tuberculosis, W. bovia ou Af. africanum possedant 
potentiellement tous les syst&mes de regulation appropries . 



Les inventeurs ont ainsi caracteris£ en particulier un 
polynucleotide constitue par une sequence de nucleotides 
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presente chez toutes les souches testees de mycobacteries 
appartenant au complexe de Mycobacterium tuberculosis. Ce 
polynucleotide, d6nomm€ DP428 contient un cadre ouvert de 
lecture (ORP) codant pour un polypeptide d» environ 12 kD. 

5 Le cadre de lecture ouvert (ORF) codant pour le polypeptide 
DP428 attend du nucleotide en position nt 941 au 
nucleotide en position nt 1351 de la sequence SEQ ID N° 2, 
le polypeptide DP428 ayant la sequence en acides amines SEQ 
ID N° 28 suivante : 

10 MKTGTATTRRRLLAVL I ALAL PG AAVALLAE PS ATG AS D PCAAS E VART VGS VAKSMGD 

YLDSHPETNQVMTAVLQQQVGPGSVASLKAHFEANPKVASDLHALSQPLTDLSTRCSLP 
I SGLQAI GLMQAVQGARR . 



15 



20 



25 



30 



Ce poids moleculaire (PM) correspond au PM theorique de 
la proteine mature obtenue apres clivage de la sequence 
signale, le PM de la proteine ou polypeptide DP428 etant 
d' environ 10 kD apres ancrage potent iel au peptidoglycane 
et coupure potentielle entre S et G du motif LPISG. 

Ce polynucleotide inclut, d'une part, un cadre ouvert de 
lecture correspondant a un gdne de structure et, d 1 autre 
part, les signaux de regulation de 1' expression de la 
sequence codante en amont et en aval de cette derniere.Le 
polypeptide DP428 est compose d'un peptide signal, d'une 
region centrale hydrophile et d'une region C-terminale 
hydrophobe. Cette derniSre se termine par deux residus 
arginines (R), signal de retention, et est precede par un 
motif LPISG qui rappelle le motif LPXTG d' ancrage au 
peptidoglycane (Schneewind et al . , 1995). 



Par g£ne de structure aux fins de la presente invention, 
on entend un polynucleotide codant pour une proteine, un 
polypeptide ou encore un fragment de ces derniers, ledit 
polynucleotide ne comprenant que la sequence correspondant 
35 au cadre ouvert de lecture (ORF), ce qui exclut les 
sequences du c6te 5 ■ du cadre ouvert de lecture (ORF) qui 
dirigent 1' initiation de la transcription. 
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35 



Ainsi, l f invention concerne en particulier un 

polynucleotide dont la sequence est choisie parmi les 
sequences nucieotidiques SEQ ID N°l ai SEQ ID N°2. 

Plus particulierement, 1' invention concerne un 

polynucleotide caracterise en ce qu'il comprend un 
polynucleotide choisi parmi : 



a) un polynucleotide dont la sequence est choisie parmi les 
sequences nucieotidiques SEQ ID N°l a SEQ ID N°2, 

b) un polynucleotide dont la sequence nucieique est la 
sequence comprise entre le nucleotide en position nt 964 
et le nucleotide en position nt 1234, extremes indues, 

15 de la sequence SEQ ID N°l, 

c) un polynucleotide dont la sequence est complementaire de 
la sequence d'un polynucleotide defini en a) ou b) , 

d) un polynucleotide dont . la sequence comporte au moins 50% 
d'identite avec un polynucleotide defini en a), b) ou c) , 

e) un polynucleotide hybridant dans des conditions de forte 
stringence avec une sequence de polynucleotide defini en 
a) , b) ,c) ou d) , 

f) un fragment d'au moins 8 nucleotides consecutifs d'un 
polynucleotide defini en a), b) , c) , d)ou e) . 



On enterid par sequence nucieotidique, polynucleotide 
ou acide nucieique, selon la presente invention, aussi bien 
un ADN double brin, un ADN simple brin que des produits de 
transcription desdits ADN. 

Par pourcentage d'identite au sens de la presente 
invention, on entend un pourcentage d'identite entre les 
bases de deux polynucleotides, ce pourcentage etant 
purement statistique et les differences entre les deux 
polynucleotides etant reparties au hasard et sur toute 
leur longueur. 
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10 



Une hybridation dans des conditions de forte 
stringence signifie que les conditions de temperature et de 
force ionique sont choisies de telle manidre qu'elles 
permettent le maintien de 1 ' hybridation entre deux 
5 fragments d 1 ADN compiementaires . 

A titre illustratif, des conditions de forte 
stringence de l'Stape d' hybridation aux fins de definir les 
fragments polynucieotidiques decrits ci-dessus, sont 
avantageusement les suivantes : 

1' hybridation est r6alis£e a une temperature 
preferentielle de 65°C, en presence de tampon commercialism 
sous le nom de rapid-hyb buffer par Amersham (RPN 1636) et 
100 Mg/ml.d f ADN de E.coli. 

Les etapes de lavage peuvent, par exemple, etre les 
suivantes : 

- deux lavages de 10 min, pref^rentiellement a 65°C, dans 
un tampon 2 x SSC et 0,1% SDS; 

- deux lavages de 10 min, pref erentiellement £ 65°C / dans 
un tampon 1 x SSC et 0,1% SDS; 

- un lavage de 10 min, pref erentiellement a 65°C, dans un 
tampon de 0,1 x SSC et 0,1% SDS. 

1 x SSC correspond & 0,15 M NaCl et 0,05M citrate de 
Na et une solution de 1 x Denhardt correspond a 0,02% 
Ficoll, 0,02% de polyvinylpyrrolidone et 0,02% de serum 
albumine bovine. 



15 



20 



25 



Avantageusement, un fragment nucieotidique rSpondant a 
la definition pr£c6dente aura au moins 8 nucleotides, de 

30 preference au moins 12 nucleotides, et encore plus 
preferentiellement au moins 20 nucleotides consecutifs de 
lasequence dont il est issu. Les conditions d' hybridation 
de forte stringence decrites ci-avant pour un 
polynucleotide d'une taille d« environ 200 bases, seront 

35 adaptees par l'homme du metier pour des oligonucleotides de 
taille plus grande ou plus petite, selon 1 ■ enseignement de 
Sambrook et al., 1989. 
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Pour les conditions de mise en oeuvre des enzymes de 
restriction dans le but d'obtenir des fragments 
nucieotidiques des polynucleotides selon 1' invention, on se 
r<§f<§rera avantageusement a l'ouvrage de Sambrook et al., 
1989. 



Avantageusement, un polynucleotide de 1» invention 
contiendra au moins une sequence comprenant 1 1 enchalnement 
10 de nucleotides allant du nucleotide en position nt 964 au 
nucleotide nt 1234 du polynucleotide de sequence SEQ ID 
N° 1. 



La prgsente invention a pour objet un polynucleotide 
15 selon 1' invention, caract<§ris£ en ce que sa sequence 
nucleique hybride avec 1'ADN de sequence de mycobacteries 
vet prefSrentiellement avec l'ADN de sequence de 
mycobacteries appartenant au complexe de Mycobacterium 
tuberculosis . 

20 

Le polynucleotide est code par une sequence 
polynucleotidique telle que decrite supra. 

La presente invention a egalement pour objet un 
25 polypeptide issu d'une mycobacterie, caract6rise en ce 
qu'il est present uniquement chez les mycobacteries 
appartenant au complexe de Mycobacterium tuberculosis. 



30 



35 



L' invention concerne egalement un polypeptide 
caracterise en ce qu'il comprend un polypeptide choisi 
parmi : 

a) un polypeptide dont la sequence d'acides amines est 
comprise dans une sequence d'acides amines choisie parmi 
les sequences d'acides amines SEQ ID N°l a SEQ ID N°24C, 
SEQ ID N° 27A a SEQ ID N° 28 et SEQ ID N° 30 a SEQ ID N° 
50F, 

b) un polypeptide homologue au polypeptide defini en a) , 
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c) un fragment d'au moins 5 acides amines d'un polypeptide 
d6f ini en a)ou b) , 

d) un fragment biologiquement actif d'un polypeptide dEfini 
en a) , b) , ou c) . 



La pr6sente invention a aussi pour objet un 
polypeptide dont la sequence d' acides amines est comprise 
dans la sequence d' acides amines SEQ ID N°l ou SEQ ID N°2, 
ou un polypeptide de sequence d f acides amines SEQ ID N°28. 



Par polypeptide homologue, on entendra designer les 
polypeptides presentant, par rapport au polypeptide naturel 
selon 1' invention tel que le polypeptide DP428, certaines 
modifications comme en particulier une deletion, addition 

15 ou substitution d'au moins un acide amin£, une troncation, 
un allongement, une fusion chimSrique, et/ou une mutation. 
Parmi les polypeptides homologues, on prefere ceux dont la 
sequence d' acides amines presente au moins 30%, de 
preference 50%, d'homologie avec les sequences d' acides 

20 amines des polypeptides selon 1' invention. Dans le cas 
d'une substitution, un ou plusieurs acides amines 
consecutifs ou non consecutifs, sont remplaces par des 
acides amines « equivalents ». L 1 expression acide amine 
« Equivalent » vise ici a designer tout acide amine 

25 susceptible d'etre substitue a l'un des acides amines de la 
structure de base sans cependant modifier essentiellement 
les propri§tes immunogenes des peptides correspondants . En 
d'autres termes, les acides amines Equivalents seront ceux 
qui permettent l'obtention d'un polypeptide de sequence 

30 modifiEe qui permet 1' induction in vivo d'anticorps ou de 
cellules capables de reconnaitre le polypeptide dont la 
sequence d' acides amines est comprise dans la sequence 
d'acides amines de polypeptide selon 1* invention, telle que 
les sequences d'acides amines SEQ ID N°l a SEQ ID N° 2, ou 

35 un polypeptide de sequence decides amines SEQ ID N°28 



5 
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(polypeptide DP428) ou l'un de ses fragments ci-dessus 
d£f inis. 

Ces aminoacyles Equivalents peuvent etre determines 
soit en s'appuyant sur leur homologie de structure avec les 
5 aminoacyles auxquels ils se substituent, soit sur les 
rSsultats des essais d' immunog£nicit£ crois6e auxquels les 
diffirents peptides sont susceptibles de donner lieu. 

A titre d'exemple, on mentionnera les possibilites de 
10 substitutions susceptibles d'etre e£fectu6es sans qu'il en 
resulte une modification approfondie de 1 1 immunogenic it6 
des peptides modifies correspondants, les remplacements, 
par exemple, de la leucine par la valine ou 1 1 isoleucine, 
de l'acide aspartique par l'acide glutamique, de la 
15 glutamine par 1 1 asparagine, de l'arginine par la lysine 
-etc., les substitutions inverses etant naturellement 
-envisageables dans les memes conditions. 

Par fragment biologiquement act if, on entendra 
2() designer en particulier un fragment de sequence d' acides 
amines de polypeptide prSsentant au moins une des 
caracteristiques des polypeptides selon 1' invention, 
notamment en ce qu'il est : 

capable d'etre exporte et/ou secrete par une 
25 mycobacterie, et/ou d'etre induit ou reprime lors de 
1* infection par la mycobacterie ; et/ou 

capable d'induire, de rSprimer ou de moduler, 
directement ou indirectement , un facteur de virulence de 
mycobacterie ; et/ou 
30 - capable d'induire une reaction d' immunogenicite dirigee 
contre les mycobacteries ; et/ou 

- capable d'etre reconnu par un anticorps specif ique de 
mycobacterie . 

35 Par fragment de polypeptide, on entend designer un 

polypeptide comportant au minimun 5 acides amines, de 
preference 10 acides amines et 15 acides amines. 
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Un 



polypeptide de 1' invention, ou un de ses 



fragments, tels que definis pr6cedemment , est susceptible 
d'etre reconnu specif iquement par les anticorps presents 
5 dans le serum de patients infectSs par des mycobacteries et 
pr£f£rentiellement des bacteries appartenant au complexe de 
Mycobacterium tuberculosis ou par des cellules de l'h6te 
inf ect£ . 



10 polypeptide dont la sequence d'acides amines est comprise 
dans la sequence d'acides amines de polypeptide selon 
1' invention, telle que les sequences d'acides amines SEQ ID 
N°l a SEQ ID N°2, ou un polypeptide de sequence decides 
amines SEQ ID N°28, qui peuvent etre obtenus par clivage 

15 dudit polypeptide par une enzyme proteolytique, telle que 
la trypsine ou la chymotrypsine ou la collagenase, ou par 
un reactif chimique, tel que le bromure de cyanogene (CNBr) 
ou encore en plaqant un polypeptide selon 1' invention tel 
que le polypeptide DP428 dans un environnement tres acide, 

20 par exemple & pH 2,5. Des fragments peptidiques preferes 
selon 1 ! invention, pour une utilisation en diagnostic ou en 
vaccination, sont les fragments contenus dans des regions 
de polypeptide selon 1' invention tel que le polypeptide 
DP428 susceptibles d'etre naturellement exposees au solvant 

25 et de presenter ainsi des propri6tes d' immunogenicite 
importante. be tels fragments peptidiques peuvent etre 
prepares indif f eremment par synthase chimique, k partir 
d'hotes transformes par un vecteur d 1 expression selon 
1' invention contenant un acide nucl^ique permettant 

30 1' expression desdits fragments, place sous le contrdle des 
elements de r6gulation et/ou d' expression appropri6s ou 
encore par clivage chimique ou enzymatique. 

Une analyse de 1 1 hydrophilicite du polypeptide DP428 a 
35 6te realised £ l'aide du logiciel DNA Strider™ 
{commercialise par le CEA Saclay) , sur la base d'un calcul 
du caractere hydrophile de la region codante pour le DP428 



Font ainsi partie de I'i 



invention les fragments du 
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de la SEQ ID N°28. Les r£sultats de cette analyse sont 
pr§sentes a la figure 54, oO sont dStailles, pour chacun 
des acides amines (AA) de position dSfinie dans la SEQ ID 
N°28, 1» indice d' hydrophilicite . Plus 1 1 indice 
5 d' hydrophilicit£ est eieve, plus l'acide amine considere 
est susceptible d'etre expose au solvant dans la molecule 
native, et est en consequence susceptible de presenter un 
degre d 1 antigenicity eieve. Ainsi, un enchainement d'au 
moins sept acides amines possedant un indice eieve 
It) d« hydrophilicite (>0,3) peut constituer la base de la 
structure d'un peptide candidat immunogene selon la 
presente invention, 

Les reponses immunitaires cellulaires de l'hote a un 
15 polypeptide selon 1» invention, peuvent etre mises en 
evidence selon les techniques decrites par Colignon et al . , 
: 1996. 

.« D'apres les donnees de la carte d • hydrophilicite 
20 v . : presentee a la Figure 54, les inventeurs ont pu definir des 
regions du polypeptide DP428 pref erentiellement exposees au 
solvant, plus particulidrement la region localisee entre 
les acides amines 55 et 72 de la sequence SEQ ID N° 28 et 
la region localisee entre les acides amines 99 et 107 de la 
25 SEQ ID N° 28. 

Les regions peptidiques du polypeptide DP428 definies 
ci-dessus peuvent etre avantageusernent mises en oeuvre pour 
la realisation des compositions immunogenes ou des 
30 compositions vaccinales selon 1' invention. 

Les polynucleotides caracterises en ce qu'ils cedent 
pour un polypeptide selon 1' invention, font egalement 
partie de 1" invention. 

35 

L' invention concerne egalement les sequences d'acide 
nucleique- utilisables comme sonde ou amorce, caracterisees 
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en ce que lesdites sequences sont choisies parmi les 
sequences d'acide nucieique de polynucleotides selon 
1 1 invention. 

5 L' invention concerne en outre 1 1 utilisation d'une 

sequence d ! acide nucieique de polynucleotides selon 
1 ! invention comme sonde ou amorce, pour la detection et/ou 
1' amplification de sequence d'acide nucieique. Parmi ces 
sequences d'acide nucieique selon 1' invention utilisables 

10 comme sonde ou amorce, on prefere les sequences d'acide 
nucieique de 1' invention, caract6ris6e en ce que lesdites 
sequences sont des sequences, ou leur sequence 
complementaire, comprises entre le nucleotide en position 
nt 964 et le nucleotide en position nt 1234, extr£mites 

15 indues, de la sequence SEQ ID N°l. 

Parmi les polynucleotides selon 1' invention, 
utilisables comme amorces nucieotidiques, on prefere 
particulierement les polynucleotides de sequence SEQ ID 
20 N°25 et SEQ ID N°26. 

Les polynucleotides selon 1' invention peuvent ainsi 
etre utilises pour selectionner des amorces nucieotidiques, 
notamment pour la technique PCR (Erlich, 1989 ; Innis et 
25 al., 1990, et, Rolfs et al. f 1991). 

Cette technique n€cessite le choix de paires 
d ! oligonucleotides encadrant le fragment qui doit etre 
amplifie. On peut, par exemple, se referer a la technique 

30 decrite dans le brevet amSricain U.S. N° 4 683 202. Ces 
amorces oligodesoxyribonucieotidiques ou oligoribo- 
nucleotidiques ont avantageusement une longueur d'au moins 
8 nucleotides, de preference d'au moins 12 nucleotides, et 
encore plus pref erentiellement au moins 20 nucleotides. On 

35 preferera en particulier des amorces d'une longueur 
comprise entre 8 et 30 et de preference 12 et 22 
nucleotides. L'une des deux amorces est compiementaires du 
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brin ( + ) [amorce aller] de la matrice et 1' autre amorce est 
complementaire du brin (-) [amorce retour] . II est 
important que les amorces ne possedent pas de structure 
secondaire ou de sequence complementaire l'une de 1' autre. 
5 D' autre part, la longueur et la sequence de chaque amorce 
doivent etre choisies de manidre £ ce que les amorces ne 
s'hybrident pas avec d'autres acides nuclSiques provenant 
de cellules procaryotes ou eucaryotes, en particulier avec 
les acides nucieiques provenant d'autres mycobacteries 
10 pathogdnes, ni avec 1 1 ADN ou 1 1 ARN humain pouvant 
eventuellement contaminer 1 • echantillon biologique. 

Les resultats pr£sent£s £ la figure 51, montrent que 
la sequence codant pour le polypeptide DP428 (SEQ ID N° 28) 
15 n'est pas retrouv§e dans les ADNs de M. for tui turn, M. 
simiae, M. avium, M. chelonae, M. flavescens, M. gordonae t 
M. marinum et M. kansasii 

Les fragments amplifies peuvent etre identifies apr£s 
20 une electrophorese en gel d' agarose ou de polyacrylamide, 
ou apres une electrophorese capillaire, ou encore apres une 
technique chromatographique (filtration sur gel, 
chromatographie hydrophobe ou chroma tographie echangeuse 
d'ions). La specificity de 1 ' amplification peut etre 
25 controlSe par hybridation moleculaire en utilisant comme 
sondes les sequences nucleotidiques de polynucleotides de 
l 1 invention, des plasmides contenant ces sequences ou leurs 
produits d« amplification. 

30 Le s fragments nucleotidiques amplifies peuvent §tre 

utilises comme react if s dans des reactions d' hybridation 
afin de mettre en evidence la presence, dans un echantillon 
biologique, d'un acide nucieique cible de sequence 
complementaire a celle desdits fragments nucleotidiques 

35 amplifies. 
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Parmi les polynucleotides selon 1' invention, 
utilisables comme sondes nuclSotidiques, on prefere tout 
particuli£rement le fragment polynucl£otidique comprenant 
la sequence comprise entre le nucleotide en position nt 964 
5 et le nucleotide en position nt 1234, extrfimites indues, 
de la sequence de SEQ ID N°l. 

Ces sondes et amplicons peuvent §tre marqu6s ou non 
par des elements radioactifs ou par des molecules non 
10 radioactives, telles que des enzymes ou des elements 
f luorescents. . 

L 1 invention vise £galement les fragments 
nucleotidiques susceptibles d'etre obtenus par 

15 amplification a l'aide d 1 amorces selon I 1 invention. 

D'autres techniques d 1 amplification de l'acide 
nucleique cible peuvent etre avantageusement employees 
comme alternatives a la PCR. 

20 La technique SDA (Strand Displacement Amplification) 

ou technique d 1 amplification a deplacement de brin (Walker 
et al. f 1992) est une technique d 1 amplification isotherme 
dont le principe est fonde sur la capacite d'une enzyme de 
restriction de couper l»un des deux brins de son site de 

25 reconnaissance qui se trouve sous une forme 
hemiphosphorothioate et sur la propriety d'une ADN 
polymerase d'initier la synthase d'un nouveau brin d' ADN S 
partir de 1* extremity 3 'OH crSSe par 1' enzyme de 
restriction et de deplacer le brin prfealablement synth§tis6 

30 qui se trouve en aval. 

Les polynucleotides de 1' invention, en particulier les 
amorces selon 1' invention, peuvent egalement etre mis en 
oeuvre dans d'autres procedes d' amplification d'un acide 
nucleique cible, tels que : 

35 - la technique TAS (Transcription-based Amplification 
System), dScrite par Kwoh et al. en 1989; 
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- la technique 3SR (Self -Sustained Sequence Replication), 
d£crite par Guatelli et al. en 1990; 

la technique NASBA (Nucleic Acid Sequence Based 
Amplification), decrite par Kievitis et al. en 1991; 
5 - la technique TMA (Transcription Mediated Amplification) . 

Les polynucleotides de 1' invention peuvent aussi etre 
employes dans des techniques d 'amplification ou de 
modification de I'acide nucl£ique servant de sonde, telles 
que : 

10 - la technique LCR (Ligase Chain Reaction) , dScrite par 
Landegren et al . en 1988 et perf ectionnee par Barany et al . 
en 1991, qui emploie une ligase thermostable; 

- la technique de RCR (Repair Chain Reaction) , dScrite par 
Segev en 1992; 

15 - la technique CPR (Cycling Probe Reaction) , dScrite par 
Duck et al. en 1990; 

- la technique d'amplif ication a la Q-beta-replicase, 
dScrite par Miele et al . en 1983 et perf ectionnee notamment 
par Chu et al . en 1986, Lizardi et al. en 1988, puis par 

20 Burg et al . ainsi que par Stone et al . en 1996. 

Dans le cas od le polynucleotide cible a detecter est 
un ARM, par exemple un ARNm, on utilisera avantageusement , 
prealablement a la mise en oeuvre d'une reaction 

25 d' amplification a 1'aide des amorces selon l 1 invention ou a 
la mise en oeuvre d'un proc£de de detection a I'aide des 
sondes de l 1 invention, une enzyme de type transcriptase 
inverse afin d'obtenir un ADNc a partir de l'ARN contenu 
dans l'Schantillon biologique. L ' ADNc obtenu servira alors 

30 de cible pour les amorces ou les sondes mises en oeuvre 
dans le precede d 1 amplification ou de detection selon 
1 'invention. 

La sonde de detection sera choisie de telle maniSre a 
35 ce qu'elle hybride avec I'amplicon genere. Une telle sonde 
de detection aura avantageusement pour sequence une 
sequence - d'au moins 12 nucleotides, en particulier d'au 
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moins 15 nucleotides, et de preference au moins de 200 
nucleotides . 

Les sondes nucieotidiques selon 1» invention sont 
capables de detecter des mycobacteries et 
5 prefSrentiellement des bactSries appartenant au complexe de 
Mycobacterium tuberculosis, plus precisgment du fait que 
ces mycobacteries possedent dans leur genome au moins une 
copie de polynucleotides selon 1" invention. Ces sondes 
selon 1' invention, sont capables, par exemple, de 

10 s'hybrider avec la sequence nucleotidique d'un polypeptide 
selon 1' invention, plus particulierement tout 
oligonucleotide hybridant avec la sequence SEQ ID N°l 
codant pour le polypeptide DP4 28 de M. tuberculosis, et ne 
presentant pas de reaction d' hybridation croisee ou 

15 d'amplif ication (PGR) avec par exemple des sequences 
presentes chez des mycobacteries n ' appartenant pas au 
complexe de Mycobacterium tuberculosis. Les sondes 
nucieotidiques selon 1' invention hybrident specif iquement 
avec une molecule d'ADN ou d 1 ARN de polynucleotide selon. 

20 1* invention, dans des conditions d' hybridation de forte 
stringence telles que donnees sous forme d' exemple 
precedemment . 

Les sequences non marquees peuvent etre utilisees 
25 directement comme sondes, cependant les sequences sont 
generalement marquees par un element radioactif ("p, J5 s, 
3 H, 12S I) ou par une molecule non-radioactive (biotine, 
acetylaminofluorene, digoxigenine, 5-bromo-desoxyuridine, 
fluoresceine) pour obtenir des sondes utilisables pour de 
30 nombreuses applications. 

Des exemples de marquages non radioactifs de sondes 
sont decrits, par exemple, dans le brevet fran<?ais N° 
78.10975 ou par Urdea et al. ou par Sanchez -Pescador et al. 
35 en 1988. 
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Dans ce dernier cas f on pourra aussi utiliser l'une 
des m£thodes de marquage decrites dans les brevets FR 2 422 
956 et FR 2 518 755. La technique d» hybridation peut etre 
r£alis6e de mani£res diverses (Matthews et al . , 1988). La 

5 m£thode la plus g6n6rale consiste & immobiliser I'acide 
nucleique extrait des cellules de mycobact£ries sur un 
support (tel que nitrocellulose, nylon, polystyrdne) et a 
incuber, dans des conditions bien d6finies, I'acide 
nucleique cible immobilis6 avec la sonde. Apres 

10 1' hybridation, l'exces de sonde est elimine et les 
molecules hybrides formSes sont d6tect£es par la m£thode 
appropriee (mesure de la radioactivite, de la fluorescence 
ou de l'activite enzymatique li6e a la sonde). 

15 Avantageusement , les sondes nucleotidiques marquees 

selon 1* invention peuvent avoir une structure telle 
qu'elles rendent possible une amplification du signal 
radioactif ou non-radioactif . Un systfeme d 1 amplification 
repondant a la definition ci-dessus comprendra des sondes 

20 '-de detection sous la forme d'un ADN ramifie, branche 
(^branched DNA») telles que celles decrites par Urdea et 
al. en 1991. Selon cette technique, on utilisera avanta- 
geusement plusieurs types de sondes notamment une sonde de 
capture, afin d" immobiliser 1 1 ADN ou l'ARN cible sur un 

25 support, et une sonde de detection. La sonde de detection 
lie un ADN «branch6» prSsentant une structure ramifiee. 
L'ADN branche, k son tour, est capable de fixer des sondes 
oligonucl£otidiques qui sont elles-memes couplees a des 
molecules de phosphatase alcaline. Puis l'activite de cette 

30 enzyme est mise en evidence grace & un substrat chimio- 
luminescent, par exemple un d6riv£ du dioxetane-phosphate . 

Selon un autre mode avantageux de mise en oeuvre des 
sondes nucl6iques selon 1' invention, ces dernieres peuvent 
35 Stre immobilisSes sur un support, de maniSre covalente ou 
non covalente, et utilises comme sondes de capture. Dans 
ce cas, une sonde, dite «sonde de capture*, est immobilisee 
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sur un support et sert a capturer par hybridation sped- 
fique l'acide nucleique cible obtenu £ partir de l'ichan- 
tillon biologique a tester. Si necessaire, le support 
solide est s6par6 de 1 1 Schantillon et le duplex forme entre 
5 la sonde de capture et l'acide nucleique cible est ensuite 
detecte grSce a une seconde sonde, dite «sonde de 
detection* , marquee par un Element facilement detectable. 

Les fragments oligonucieotidiques peuvent Stre obtenus 
10 a partir des sequences selon 1' invention, par coupure avec 
des enzymes de restriction, ou par synthase chimique selon 
les methodes classiques, par exemple selon la methode 
decrite dans le brevet europeen N° EP-0305929 (Millipore 
Corporation) ou encore par d'autres procedes. 
15 Un mode de preparation approprie des acides nucleiques 

de 1' invention comportant au maximum 200 nucleotides (ou 
200 pb s'il s'agit d' acides nucleiques bicatenaires) 
comprend les Stapes suivantes : 

- la synthese d'ADN en utilisant la methode automatisee des 
20 beta-cyanethylphosphoramidite decrite en 198 6, 

- le clonage des acides nucleiques ainsi obtenus dans un 
vecteur approprie et la recuperation des acides nucleiques 
par hybridation avec une sonde appropriee. 

Un mode de preparation, par voie chimique, d» acides 
25 nucleiques selon I 1 invention de longueur superieure & 200 
nucleotides (ou 200 pb lorsqu'il s'agit d' acides nucleiques 
bicatenaires) comprend les etapes suivantes : 

- 1' assemblage d' oligonucleotides synthetises chimiquement , 
pourvus a leur extremite de sites de restrictions 

30 differents, dont les sequences sont compatibles avec 
1 1 enchainement en acides amines du polypeptide naturel 
selon le principe decrit en 1983, 

- le clonage des acides nucleiques ainsi obtenus dans un 
vecteur approprie et la recuperation des acides nucleiques 

35 recherches par hybridation avec une sonde appropriee. 
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Les sondes nucieotidiques utilisees pour la 
recuperation des acides nucieiques recherch€s dans les 
proc<§d§s sus-mentionnes, sont constitutes gtntralement de 8 
a 200 nucleotides de la sequence de polypeptide selon 
1' invention et sont susceptibles de s'hybrider avec l'acide 
nucieique recherche dans les conditions d 1 hybridation 
dgfinies pr6c6demment . La synthase de ces sondes peut etre 
ef£ectu6e selon la methode automatiste des beta 
cyanethylphosphoramidites decrite en 1986. 



Les sondes oligonucleotidiques selon 1' invention 
peuvent etre mises en oeuvre au sein d'un dispositif de 
detection comprenant une banque matricielle 

d> oligonucleotides. Un exemple de realisation d'une telle 
15 banque matricielle peut consister en une matrice 
d 1 oligonucleotides sondes fix§s sur un support, la sequence 
de chaque sonde d'une longueur donnee etant situee en 
decalage d'une ou plusieurs bases par rapport 5 la sonde 
precedente, chacune des sondes de 1 * arrangement matriciel 
.vetant ainsi compiementaire d'une sequence distincte de 
I'ADN ou 1'ARN cible a detecter et chaque sonde de sequence 
connue etant fixee en une position predeterminee du 
support. La sequence cible a detecter peut etre 
avantageusement marquee radioactivement ou non 
radioactivement. Lorsque la sequence cible marquee est mise 
en contact avec le dispositif matriciel, celle-ci forme des 
hybrides avec les sondes de sequences compiementaires . Un 
traitement k la nuclease, suivi d'un lavage, permet 
d'eiiminer les hybrides sondes -sequence cible qui ne sont 
30 pas parfaitement compiementaires. Du fait de la 
connaissance precise de la sequence d'une sonde h une 
position determinee de la matrice, il est alors possible de 
deduire la sequence nucieotidique de la sequence d'ADN ou. 
d'ARN cible. Cette technique est particuli£rement efficace 
35 lorsque sont utilisees des matrices de sondes 
oligonucleotidiques de grande taille. 
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Une alternative a 1 1 utilisation d'une sequence cible 
marquee peut consister en 1 1 utilisation d'un support 
permettant une detection « bioeiectronique » de 
1 1 hybridation de la sequence cible sur les sondes du 
support matrice, lorsque que ledit support est constituS ou 
comprend un mater iau capable d'agir, par exemple, en tant 
que donneur d' Electrons aux positions de la matrice 
auxquelles un hybride a 6t6 forme. Un tel materiau donneur 
d Electron est par exemple de l'or. La detection de la 
sequence nucleotidique de 1 9 ADN ou ARN cible est alors 
determinee par un dispositif electronique . 



Un exemple de realisation d'un biocapteur, tel que 
dgfini ci-dessus, est decrit dans la demande de brevet 
europeen N° EP-0721 016 au nom de Affymax technologies N.V. 
ou encore dans le brevet americain N° US 5.202.231 au nom 
de Drmanac . 

L 1 invention a aussi pour objet les polynucleotides 
hybrides resultant : 

- soit de la formation d'une molecule hybride entre un ARN 
ou un ADN (ADN genomique ou ADNc) provenant d'un 
echantillon biologique avec une sonde ou une amorce selon 
1 1 invention. 

- soit de la formation d'une molecule hybride entre un ARN 
25 ou un ADN (ADN genomique ou ADNc) provenant d'un 

echantillon biologique avec un fragment nucleotidique 
amplifie a 1'aide d'un couple d'amorces selon 1'invention. 

Par ADNc au sens de la present e invention, on entend 
une molScule d' ADN obtenue en faisant agir une enzyme de 
type transcriptase inverse sur une molecule d' ARN, en 
particulier une molecule d'ARN messager (ARNm) , selon les 
techniques decites dans Sambrook et al. en 1989. 

La presente invention a egalement pour objet une 
famille de plasmides recombinants, caracterises en ce 
qu'ils contiennent au moins une sequence nucleotidique de 
polynucleotide selon 1'invention. Selon un mode de 
realisation avantageux dudit plasmide, il comprend la 
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sequence nucieotidique SEQ ID N°l ou un fragment de celle- 
ci. 

Un autre objet de la pr^sente invention est un vecteur 
pour le clonage,l' expression et/ou 1' insertion d'une 
5 sequence, caract6ris£ en ce qu'il comprend une sequence 
nucieotidique de polynucleotide selon 1' invention en un 
site non essentiel pour sa replication, le cas £ch6ant sous 
le controle d' elements de regulation susceptibles 
d ! intervenir dans l'expression du polypeptide DP428, chez 
10 un hote determine. 

Des vecteurs particuliers sont par exemple des 
plasmides, des phages, des cosmides, des phagemides, des 
YAC . 

Ces vecteurs sont utiles pour transformer des cellules 
15 notes afin de doner ou d'exprimer les sequences 
nucleotidiques de 1' invention. 

L r invention comprend egalement les cellules botes 
transformees par un vecteur selon 1' invention, 

20 

De preference, les cellules notes sont transformees 
dans des conditions permettant l'expression d'un 
polypeptide recombinant selon 1' invention. 

25 Une cellules h6te preferee selon 1' invention est la 

souche E. col'i transformee par le plasmide pDP428 depose le 
28 janvier 1997 a la CNCM sous le N°I-1818 ou transformee 
par le plasmide pMlC25 depose le 4 aoQt 1998 a la CNCM sous 
le n° 1-2062 ou une mycobacterie appartenant a une souche 

30 de M. tuberculosis, M.bovia ou M.africanu/n possedant 
potentiellement tous les systemes de regulation appropries. 

II est aujourd'hui facile de produire des proteines ou 
polypeptides en quantite relativement importante par genie 
genetique en utilisant comme vecteurs d 1 expression des 

35 plasmides, des phages, des phagemides. Tout ou partie du 
gSne DP428, ou tout polynucleotide selon 1' invention, peut 
Stre insere dans un vecteur d« expression approprie pour 
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produire in vitro un polypeptide selon 1 » invention, 
notamment le polypeptide DP428. Ledit polypeptide pourra 
etre fixe sur une microplaque pour developper un test 
sgrologique destine a rechercher, dans un but de 
5 diagnostic, les anticorps sp6cifiques chez les patients 
atteints de tuberculose. 

Ainsi, la presente invention concerne un procede de 
preparation d'un polypeptide, characterise en ce qu'il met 
10 en oeuvre un vecteur selon 1- invention. Plus 
particulierement l 1 invention concerne un proc6de de 
preparation d'un polypeptide de 1» invention comprenant les 
Stapes suivantes : 

- le cas echeant, 1 1 amplification pr^alable suivant la 

!5 technique PCR de la quantite de sequences de nucleotides 
codant pour ledit polypeptide a l'aide de deux amorces 
d'ADN choisies de maniSre a ce que I'une de ces amorces 
soit identique aux 10 a 25 premiers nucleotides de la 
sequence nucleotidique codant pour ledit polypeptide, 

20 tandis que 1' autre amorce est compiementaire des 10 a 25 
derniers nucleotides (ou s'hybride avec ces 10 a 25 
derniers nucleotides) de ladite sequence nucleotidique, ou 
inversement de maniere a ce que I'une de ces amorces soit 
identique aux 10 a 25 derniers nucleotides de ladite 

25 sequence, tandis que 1' autre amorce est complement aire des 
10 a 25 premiers nucleotides (ou s'hybride avec les 10 a 25 
premiers nucleotides) de ladite sequence nucleotidique, 
suivie de 1 ■ introduction desdites sequences ainsi 
amplifiees dans un vecteur approprie, 

30 - la mise en culture, dans un milieu de culture approprie, 
d'un h6te cellulaire prealablement transforme par un 
vecteur approprie contenant un acide nucleique selon 
1' invention comprenant la sequence nucleotidique codant 
pour ledit polypeptide, et 

35 - la separation, a partir du susdit milieu de culture, 
dudit polypeptide produit par ledit h5te cellulaire 
transforme. 
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L ' invention a aussi pour objet un polypeptide 
susceptible d'etre obtenu par un proc£d6 de 1' invention tel 
que d§crit pr6c6demment . 
5 Les peptides selon 1' invention peuvent 6galement etre 

pr£par£s par les techniques classiques, dans le domaine de 
la synthese des peptides. Cette synthese peut etre rSalis§e 
en solution homog&ne ou en phase solide. 

Par exemple, on aura recours a la technique de 
10 synthase en solution homogene decrite par Houbenweyl en 
1974. 

Cette methode de synthese consiste £ condenser 
successivement deux-S-deux les aminoacyles successifs dans 

15 l'ordre requis, ou a condenser des aminoacyles et des 
fragments prSalablement formes et contenant deja plusieurs 
aminoacyles dans l'ordre appropri£, ou encore plusieurs 
fragments pr£alablement ainsi prepares, etant entendu que 
l'on aura eu soin de proteger au prealable toutes les 

211 fonctions reactives portees par ces aminoacyles ou 
fragments, a l 1 exception des fonctions amines de l'un et 
carboxyles de 1' autre ou vice- versa, qui doivent 
normalement intervenir dans la formation des liaisons 
peptidiques, notamment apres activation de la fonction 

25 carboxyle, selon les mSthodes bien connues dans la synthese 
des peptides." En variante, on pourra avoir recours a des 
reactions de couplage mettant en jeu des rSactifs de 
couplage classique, du type carbodiimide, tels que par 
exemple la l-§thyl-3- (3 -dimethyl -aminopropyl) -carbodiimide. 

30 Lorsque l'aminoacyle mis en oeuvre possSde une 

fonction acide supplSmentaire (notamment dans le cas de 
l'acide glutamique) , ces fonctions seront prot6gees, par 
exemple par des groupes t-butylester . 

Dans le cas de la synthese progressive, acide amine 

35 par acide amine, la synthase debute de preference par la 
condensation de 1 ' amino-acide C-terminal avec l'aminoacide 
qui correspond & l'aminoacyle voisin dans la sequence 
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dSsiree et ainsi de suite, de proche en proche, jusqu'a 
l f acide amin£ N- terminal . 

Selon une autre technique pr6f6r£e de 1' invention, on 
a recours a celle dScrite par Merrifield. 

5 Pour fabriquer une chaine peptidique selon le procSde 

de Merrifield, on a recours a une r£sine polym£re tres 
poreuse, sur laquelle on fixe le premier acide aminS C- 
terminal de la chaine. Get acide aming est fixS sur la 
rSsine par 1 1 intermSdiaire de son groupe carboxylique et sa 

10 fonction amine est protSgSe, par exemple par le groupe t- 
butyloxycarbonyle . 



Lorsque le premier acide amin£ C-terminal est ainsi 
fixe sur la r€sine, on enleve le groupe protecteur de la 
15 fonction amine en lavant la rSsine avec un acide. 

Dans le cas oil le groupe protecteur de la fonction 
amine est le groupe t-butyloxycarbonyle, il peut etre 
elimin<§ par traitement de la resine a 1'aide decide 
20 . trif luoroacet ique . 

On couple ensuite le deuxidme acide aminS qui fournit 
le second aminoacyle de la sequence recherchee, a partir du 
residu aminoacyle C-terminal sur la fonction amine 
deprotegSe du premier acide amine C-terminal fixS sur la 
chaine. De pr6f£rence, la fonction carboxyle de ce deuxiSme 
acide aminS est activSe, par exemple par la 
dicyclohexylcarbodiimide, et la fonction amine est 
protegSe, par exemple par le t-butyloxycarbonyle. 

On obtient ainsi la premiere partie de la chaine 
peptidique recherchee, qui comporte deux acides amines, et 
dont la fonction amine terminale est protegee. Comme 
prScSdemment, on dSprotdge la fonction amine et on peut 
ensuite proceder a la fixation du troisiSme aminoacyle, 
dans des conditions analogues a celles de 1' addition du 
deuxidme acide amin6 C-terminal. 
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On fixe ainsi, les uns apres les autres, les acides 
amines qui vont constituer la chaine peptidique sur le 
groupe amine chaque fois deprotege au prealable de la 
portion de la chaine peptidique deja formee, et qui est 
rattachee a la resine. 

Loraque la totalite de la chaine peptidique desiree 
est formee, on elimine les groupes protecteurs des 
differents acides amines constituant la chaine peptidique 
et on detache le peptide de la resine, par exemple a l'aide 
d 1 acide f luorhydrique . 

De maniere pref erentielle, lesdits polypeptides 
susceptibles d'etre obtenus par un procede de 1' invention 
tel que decrit precedemment comprendront une region exposee 
au solvant et auront une longueur d'au moins 20 acides 
amines . 

Selon un autre mode de realisation de 1' invention, 
lesdits polypeptides sont specif iques de mycobacteries du 
complexe Mycobacterium tuberculosis et ne sont done pas 

reconnus par des anticorps specifiques d'autres proteines 
de mycobactSries . 

L 1 invention est en outre relative a des polypeptides 
25 hybrides presentant au moins un polypeptide selon 
1' invention et une sequence d'un polypeptide susceptible 
d'induire une reponse immunitaire chez l'homme ou 1' animal. 

Avantageusement, le determinant antigenique est tel 
qu-il est susceptible d'induire une reponse humorale et/ou 
30 cellulaire. 

Un tel determinant pourra comprendre un polypeptide 
selon 1- invention sous forme glycosylee utilise en vue 
d'obtenir des compositions immunogenes susceptibles 
35 d'induire la synthase d'anticorps diriges centre des 
Epitopes multiples. Lesdits polypeptides glycosyles font 
Sgalemenfpartie de 1' invention. 
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Ces mol6cules hybrides peuvent etre constitutes en 
partie d'une molecule porteuse de polypeptide selon 
1* invention associee a une partie, en particulier un 
epitope de la toxine diphterique, la toxine tetanique, un 
5 antigene de surface du virus de 1' hepatite B (brevec FR 79 
21811), l'antigene VPi du virus de la poliomyelite ou toute 
autre toxine ou antigene viral ou bacterien, 

Avantageusement, ledit determinant antigenique 
l« correspond a un determinant antigenique de proteines 
immunogenes de 45/47 kD de M. tuberculosis (demande 
Internationale PCT/PR 96/0166) , ou encore selectionnees par 
exemple parmi ESAT6 (Harboe et al . , 1996, Andersen et al . , 
1995, et Sorensen et al . , 1995) et DES (PCT/FR 97/00923. 
15 Gicquel et al. ) . 
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Un antigene viral, tel que defini ci-dessus, sera 
preferentiellement une proteine de surface ou d'enveloppe 
d'un virus de 1' hepatite, par exemple la proteine de 
surface de 1' hepatite B sous l'une de ses formes S, S- 
preSl, S-preS2 ou S-preS2-preSl ou encore une proteine d'un 
virus de 1 'hepatite A, ou d'une hepatite non-A, non-B, tel 
qu'un virus de 1' hepatite C, E ou delta. 

Plus particulierement, un antigene viral tel que 
d6fini ci-dessus sera tout ou partie de l'une des 
glycoproteins codees par le genome du virus HIV-l (brevets 
GB 8324800, EP 84401834 ou EP 8590S513) ou du virus HIV-2 
(EP 87400151), et en particulier tout ou partie d'une 
proteine selectionnee parmi gag, pol, nef ou env de HIV-l 
ou de HIV-2. 

Les procedes de synthese des molecules hybrides 
englobent les methodes utilisees en genie genetique pour 
construire des polynucleotides hybrides codant pour les 
sequences polypeptidiques recherchees. On pourra, par 
exemple, 'se referer avantageusement a la technique 
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d'obtention de genes codant pour des proteines de fusion 
decrite par Minton en 1984. 

Lesdits polynucleotides hybrides codant pour un 
polypeptide hybride ainsi que les polypeptides hybrides 
selon 1' invention caracterises en ce qu'il s'agit de 
proteines recombinantes obtenues par 1 'expression desdits 
polynucleotides hybrides, font egalement partie de 
1 1 invention. 

Les polypeptides selon 1' invention peuvent 
avantageuseraent etre mis en oeuvre dans un procede pour la 
detection in vitro d'anticorps diriges contre lesdits 
polypeptides, notamment le polypeptide DP428, et ainsi 
d'anticorps diriges contre une bacterie du complexe 
Mycobacterium tuberculosis, dans un echantillon biologique 
(tissu ou fluide biologique) susceptible de les contenir, 
ce procede comprenant la rnise en contact de cet echantillon 
biologique avec un polypeptide selon 1' invention dans des 
conditions permettant une reaction immunologique in vitro 
entre ledit polypeptide et les anticorps eventuellement 
presents dans 1 1 echantillon biologique, et la mise en 
evidence in vitro des complexes antigene- anticorps 
eventuellement formes. 



Les polypeptides selon 1' invention peuvent egalement 
et avantageusement etre mis en oeuvre dans un proc6de pour 
la detection d'une infection par une bacterie du complexe 
Mycobacterium tuberculosis dans un mammifere base sur la 
detection in vitro d'une reaction cellulaire indiquant une 
sensibilisation pr6alable du mammifere audit polypeptide 
comme par exemple la proliferation cellulaire, la synthase 
de proteines telles que 1' interferon gamma. Ce procede pour 
la detection d'une infection par une bacterie du complexe 
35 Mycobacterium tuberculosis dans un mammifere. est 
caracterise en ce qu'il comp rend les etapes suivantes : 



WO 99/09186 



:T/FR98/01813 



48 



10 



15 



20 



25 



a) preparation d'un echantillon biologique contenant des 
cellules dudit mammifere plus particulierement des cellules 
du systeme iramunitaire dudit mammifere et plus 
particulierement encore des cellules T ; 

b) incubation de 1 'echantillon biologique de l'6tape a) 
avec un polypeptide selon 1' invention; 

c) detection d'une reaction cellulaire indiquant une 
sensibilisation prealable du mammifere audit polypeptide 
comme par exemple la proliferation cellulaire et/ou la 
synthese de proteines telles que 1 ' interferon gamma. 

La proliferation cellulaire pourra etre mesuree, par 
exemple par incorporation de J H-Thymidine . 

Font egalement partie de 1' invention, les proc6des de 
detection d'une reaction d' hypersensibilite retardee (DTH) , 
caracterises en ce qu'ils mettent en oeuvre un polypeptide 
selon 1' invention. 

De preference, 1 ' echantillon biologique est constitue 
par un fluide, par exemple un serum humain ou animal, du 
sang, des biopsies, le liquide broncho-alveolaire ou le 
liquide pleural. 

Toute procedure classique peut etre mise en oeuvre 
pour realiser une telle detection. 



A titre d'exemple, une methode preferee met en jeu des 
processus immunoenzymatiques selon la technique ELISA, par 
immunofluorescence, ou radio- immunologique (RIA) ou 
30 equivalent. 

Ainsi, 1' invention concerne egalement les polypeptides 
selon 1< invention, marques a l'aide d'un marqueur adequat 
tel que du type enzymatique, fluorescent, radioactif. 
35 De telles methodes comprennent par exemple les etapes 

suivantes : 
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- depot de quantites determines d'une composition 
polypeptidique selon 1' invention dans les puits d'une 
plaque de microtitration, 

- introduction dans lesdits puits de dilutions croiasantes 
de serum, ou d 'echantillon biologique autre tel que defini 
precedemment , devant etre analyse, 

- incubation de la microplaque, 

- introduction dans les puits de la plaque de 
microtitration d'anticorps marques diriges contre des 
immunoglobulines humaines ou animales, le marquage de ces 
anticorps ayant 6te realise a l'aide d'une enzyme 
selectionnee parmi celles qui sent capables d'hydrolyser un 
substrat en modifiant 1 'absorption des radiations de ce 
dernier, au moins a une longueur d'onde determinee, par 

15 exemple a 550 nm, 

- detection, en comparaison avec un temoin de controle, de 
la quantity de substrat hydrolyse. 
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L' invention concerne egalement un necessaire ou kit 
pour le diagnostic in vitro d'une infection par une 
mycobacterie appartenant au complexe Mycobacterium 
tuberculosis, comprenant : 

- un polypeptide selon 1' invention, 

- le cas echeant les reactifs pour la constitution du 
milieu propice a la reaction immunologique ou specifique, 

- les reactifs permettant la detection des complexes 
antigene-anticorps produits par la reaction immunologique 
eventuellement presents dans 1 • echantillon biologique, et 
la mise en evidence in vitro des complexes antigene- 
anticorps eventuellement formes, ces reactifs pouvant 
egalement porter un marqueur, ou etre susceptibles d'gtre 
reconnus a leur tour par un reactif marque, plus 
particulierement dans le cas ou le polypeptide selon 
1' invention n'est pas marque, 

- le cas echeant, un echantillon biologique de reference 
(temoin n<§gatif) depourvu d'anticorps reconnus par un 
polypeptide selon 1' invention, 
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- le cas echeant, un echantillon biologique de reference 
(temoin positif) contenant une quantity predetermine 
d' anticorps reconnus par un polypeptide selon 1 ' invention . 

5 Les polypeptides selon 1- invention permettent de 

preparer des anticorps monoclonaux ou polyclonaux 
caracterises en ce qu'ils reconnaissent sp6cif iquement les 
polypeptides selon 1' invention. Les anticorps monoclonaux 
pourront avantageusement etre prepares a partir 

10 d'hybridomes selon la technique decrite par Kohler et 
Milstein en 1975. Les anticorps polyclonaux pourront etre 
prepares, par exemple par immunisation d'un animal, en 
particulier une souris, avec un polypeptide selon 
1' invention associe a un adjuvant de la reponse 

15 immunitaire, puis purification des anticorps specif iques 
contenus dans le serum des animaux immunises sur une 
colonne d'af finite sur laquelle a prSalablement ete fixe le 
polypeptide ayant servi d'antigene. Les anticorps 
polyclonaux selon 1- invention peuvent aussi etre prepares 

20 par purification sur une colonne d'af finite, sur laquelle a 
prealablement ete immobilise un polypeptide selon 
1' invention, des anticorps contenus dans le serum de 
patients infectes par une mycobacterie et 
preferentiellement une bacterie appartenant au complexe 

25 WycoJbacterium tuberculosis. 



L' invention a egalement pour objet des anticorps mono 
ou polyclonaux ou leurs fragments, ou anticorps 
30 chimeriques, caracterises en ce qu'ils sont capables de 
reconnaitre specif iquement un polypeptide . selon 
1' invention. 

Les anticorps de 1' invention pourront egalement etre 
35 marques de la meme maniere que decrit precedemment pour les 
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sondes nucleiques de 1' invention tel qu'un marquage de type 
enzymatique, fluorescent ou radioactif. 

L' invention viae en outre un precede pour la detection 
specif ique de la presence d'un antigene d'une mycobacterie 
et preferentiellement un bacterie du complexe Mycobacterium 
tuberculosis dans un echantillon biologique, caracterise en 
ce qu'il comprend les etapes suivantes : 



a) Mise en contact de 1 • echantillon biologique (tissu ou 
fluide biologique) preleve chez un individu avec un 
anticorps mono ou polyclonal selon 1' invention , dans des 
conditions permettant une reaction immunologique in vitro 
entre lesdits anticorps et les polypeptides specifiques des 
mycobacteries et preferentiellement des bacteries du 
complexe de Mycobacterium tuberculosis eventuellement 
presents dans 1 ' echantillon biologique, et 

b) ,Mise en evidence du complexe antigene-anticorps forme. 

20 Entre egalement dans le cadre de 1' invention, un 

necessaire ou kit pour le diagnostic in vitro sur un 
Echantillon biologique, de la presence de souches de 
mycobacteries des mycobacteries et preferentiellement des 
bacteries appartenant au complexe de Mycobacterium 
tuberculosis, de preference M. tuberculosis, caracterise en 
ce qu'il comprend : 

- un anticorps polyclonal ou monoclonal selon 1' invention, 
le cas echeant marquS; 

- le cas echeant, un reactif pour la constitution du milieu 
propice a la realisation de la reaction immunologique; 

- un reactif permettant la detection des complexes 
antigene-anticorps produits par la reaction immunologique, 
ce reactif pouvant egalement porter un marqueur, ou etre 
susceptible d'etre reconnu a" son tour par un reactif 

35 marque, plus particulierement dans le cas oCt ledit 
anticorps monoclonal ou polyclonal n'est pas marque. 
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- le cas echeant, des reactifs pour effectuer la lyse des 
cellules de 1 ' echantillon teste. 

La presente invention a egalement pour objet un 
precede de detection et d' identification rapide des 
mycobacteries et preferentiellement des bacteries de M. 
tuberculosis dans un echantillon biologique, caracterise 
en ce qu'il comporte les etapes suivantes : 

a) Isolement de 1 * ADN a partir de 1 > echantillon 
biologique a analyser, ou obtention d'un ADNc a partir de 
l'ARN de 1' echantillon biologique ; 

b) Amplification sp6cifique de 1 'ADN des mycobacteries et 
preferentiellement des bacteries appartenant au complexe 
Mycobacterium tuberculosis a l'aide d' amorces selon 

15 1 ' invention; 

c) Analyse des produits d' amplification. 

Le produits d' amplification peuvent etre analyses par 
differences mSthodes. 

Deux methodes d' analyse sont donnees a titre d'exemple 
ci-dessous : 

- Analyse electrophoretique en gel d' agarose des 
produits d' amplification. La presence d'un fragment d' ADN 
migrant a l'endroit attendu suggere que 1 ' echantillon 
analyse contenait de 1 'ADN de mycobacteries appartenant au 
complexe tuberculosis, ou 

- Analyse par la technique d' hybridation moleculaire 
en utilisant une sonde nucleique selon 1' invention. Cette 
sonde sera avantageusement marquee par un element non 
radioactif (sonde froide) ou radioactif. 
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Aux fins de la presente invention, on entendra par 
« ADN de 1- echantillon biologique » ou « ADN contenu dans 
1' echantillon biologique », soit 1 ' ADN present dans 
35 1 echantillon biologique considere, soit l'ADNc obtenu 
apres 1' action d'une enzyme de type transcriptase inverse 
sur l'ARN present dans ledit echantillon biologique. 
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Un autre precede de la presente invention permet la 
detection d'une infection par une mycobacterie et 
5 preferentiellement une bacterie du complexe Mycobacterium 
tuberculosis dans un mammifere. Ce procede coraprend les 
etapes suivantes : 

a) preparation d'un echantillon biologique contenant des 
cellules dudit mammifere plus particulierement des cellules 

10 du systeme immunitaire dudit mammifere et pl us 
particulierement encore des cellules T ; 

b) incubation de 1' echantillon biologique de l'etape a) avec 
un polypeptide selon 1 ' invention; 

c) detection d'une reaction cellulaire indiquant une 
15 sensibilisation prealable du mammifere audit polypeptide 

notamment la proliferation cellulaire et/ou la synthese de 
proteines telles que 1' interferon gamma; 

d) detection d'une reaction d' hypersensibilite retardee ou 
de sensibilisation du mammifere audit polypeptide 

20 

Cette methode de detection est une methode 
intradermique, qui est decrite par exemple par M. J. Elhay 
et al. (1988) Infection and Immunity, 66(7) : 3454-3456. 

Un autre but de la presente invention consiste en un 
procede pour la detection des mycobacteries et 
preferentiellement des bacteries appartenant au complexe 
Mycobacterium tuberculosis dans un echantillon biologique, 
caracterise en ce qu'il comprend les etapes suivantes : 
a) Mise en contact d'une sonde oligonucleotidique selon 
1' invention avec un echantillon biologique, l'ADN contenu 
dans l'echantillon biologique, ou I'ADNc obtenu par 
transcription inverse de l'ARN de l'echantillon biologique, 
ayant, le cas echeant, prealablement 6te rendu accessible a 
1' hybridation, dans des conditions permettant 1 -hybridation 
de la sonde a l'ADN ou I'ADNc des mycobacterias et 
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preferentiellement des bacteries du complexe Mycobacterium 
tuberculosis; 

b) Detection de l'hybride forme entre la sonde 
oligonucleotidique et 1 * ADN de 1 ' echantillon biologique. 

L' invention vise egalement un procede pour la detection 
des mycobacteries et preferentiellement des bacteries 
appartenant au complexe Mycobacterium tuberculosis dans un 
echantillon biologique, caracterise en ce qu'il comprend 
les Stapes suivantes : 

a) Mise en contact d'une sonde oligonucleotidique selon 
1" invention immobilisee sur un support. avec un 
echantillon biologique, 1 1 ADN de 1 • echantillon biologique 
ayant, le cas echeant, ete prealablement rendu accessible a 
1' hybridation, dans des conditions permettant 1 ' hybridation 
de ladite sonde a 1 'ADN des mycobacteries et 
preferentiellement des bacteries du complexe Mycobacterium 
tuberculosis; 

b) Mise en contact de l'hybride forme entre ladite sonde 
oligonucleotidique immobilisee sur un support et 1 ' ADN 
contenu dans 1 • echantillon biologique, le cas echeant apres 
elimination de 1 'ADN de 1 ' echantillon biologique n' ayant 
pas hybride avec la sonde, avec une sonde 
oligonucleotidique marquee selon 1' invention. 

Selon un mode de realisation avantageux du procede de 
detection dSfini precedemment , celui-ci est caracterise en 
ce que, prealablement a l'etape a), 1 ' ADN de 1 ' echantillon 
biologique est prealablement amplify £ i-aide d'un couple 
d' amorces selon 1' invent ion. 



Une autre forme de mise en oeuvre du procedS de 
detection selon 1' invention consiste en un procede pour la 
detection de la presence des mycobacteries et 
35 preferentiellement des bacteries appartenant au complexe de 
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Mycobacterium tuberculosis dans un echantillon biologique, 
caracterise en ce qu'il comprend les etapes suivantes : 

a) Mise en contact de l'echantillon biologique avec un 
couple d' amorces selon 1' invention, 1 ' ADN concern; dans 
l'echantillon ayant ete, le cas ech6ant, prealablement 
rendu accessible a 1 -hybridation, dans des conditions 
permettant une hybridation desdites amorces a 1 ' ADN des 
mycobacteries et preferentiellement des bacteries du 
complexe Mycobacterium tuberculosis; 
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b) Amplification de 1 1 ADN d'une mycobacterie et 
preferentiellement d'une bacterie du complexe Mycobacterium 
tuberculosis ; 

O mise en evidence de 1 • amplification de fragments d ' ADN 
correspondant au fragment encadre par les amorces, par 
exemple par electrophorese sur gel ou au moyen d'une sonde 
oligonucleotidique selon invention. 

L 1 invention a aussi pour objet un precede pour la 
detection de la presence des mycobacteries et 
preferentiellement des bacteries appartenant au complexe de 
Mycobacterium tuberculosis dans un echantillon biologique 
par deplacement de brin, caracterise en ce qu'il comprend 
les Stapes suivantes : 

a) Mise en contact de l'echantillon biologique avec deux 
couples d'amorces selon 1'invention spScif iquement 
destinies a 1 'amplification de type SDA decrites ci-dessus 
l'ADN contenu dans l'echantillon ayant ete, le cas echeant,' 
prealablement rendu accessible a 1 • hybridation, dans des 
conditions permettant une hybridation des amorces a l'ADN 
des mycobacteries et preferentiellement des bacteries du 
complexe Mycobacterium tuberculosis; 
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b) amplification de 1 1 ADN des mycobacteries et 
preferentiellement des bacteries du complexe Mycobacterium 
tuberculosis; 

c) raise en evidence de 1 'amplification de fragments d'ADN 
correspondant au fragment encadre par les amorces, par 
exemple par §lectrophorese sur gel ou au moyen d'une sonde 
oligonuclSotidique selon 1' invention. 

L' invention concerne aussi un necessaire ou kit pour 
la mise en oeuvre du precede decrit ci-dessus, destine a la 
detection de la presence des mycobacteries et 
preferentiellement des bacteries du complexe Mycobacterium 
tuberculosis dans un echantillon biologique, caracterise en 
ce qu'il comprend les elements suivants : 

a) Une sonde oligonucleotidique selon 1 ' invention; 

b) Les reactifs necessaires a la mise en oeuvre d'une 
reaction d ' hybridation ; 

O Le cas echeant, un couple d' amorces selon 1' invention 
ainsi que les reactifs necessaires a une reaction 
d' amplification de l'ADN (ADN genomique, ADN plasmidique ou 
ADNc) des mycobacteries et preferentiellement des bacteries 
du complexe Mycobacterium tuberculosis. 

L- invention a aussi pour objet un kit ou necessaire 
pour la detection de la presence des mycobact6ries et 
preferentiellement des bacteries du complexe Mycobacterium 
tuberculosis dans un echantillon biologique, caracterise en 
ce qu'il comprend les elements suivants : 

a) Une sonde oligonucleotidique, dite sonde de capture, 
30 selon 1 ' invention; 

b) Une sonde oligonucleotidique, dite sonde de 
revelation, selon 1' invention. 

O Le cas echeant, un couple d' amorces selon 1 ' invention 
ainsi que les reactifs necessaires a une reaction 
35 d'amplification de 1 'ADN des mycobacteries et 
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prSferentiellement des bacteries du complexe Mycobacterium 
tuberculosis. 

L' invention concerne encore un kit ou necessaire pour 

1' amplification de l'ADN des mycobacteries et 

prSferentiellement des bacteries du complexe Mycobacterium 

tuberculosis present dans un echantillon biologique, 

caracterise en ce qu'il comprend les elements suivants : 

a) Un couple d' amorces selon 1' invention; 

b) Les reactifs n6cessaires pour effectuer une reaction 
d' amplification d'ADN; 

c) Eventuellement un composant permettant de verifier la 
sequence du fragment amplifie, plus particulierement une 
sonde oligonucleotidique selon 1« invention. 

Un autre objet de la presente invention concerne une 
composition immunogene, caracterisee en ce qu'elle comprend 
un polypeptide selon l'invention. 

Une autre composition immunogene selon l'invention est 
caracterise en ce qu'elle comprend un ou plusieurs 
polypeptides selon l'invention et/ou un ou plusieurs 
polypeptides hybrides selon l'invention. 

Selon un mode de realisation avantageux, la 
composition immunogene ci-dessus definie est constitutive 
d'un vaccin, lorsqu'elle est presentee en association avec 
un vehicule pharmaceutiquement acceptable et eventuellement 
un ou plusieurs adjuvants de l'immunite tels que l'alun ou 
un representant de la famille des muramyl peptides ou 
encore 1' adjuvant incomplet de Freund. 

Aujourd'hui, divers types de vaccina sont disponibles 
pour proteger l'homme contre des maladies infectieuses ; 
micro-organismes vivants attenues (M. bovis - BCG pour la 
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tuberculose) , micro-organismes inactive (virus de la 
grippe), des extraits acellulaires (Bordetella pertussis 
pour la coqueluche), prolines recombinees (antigene de 
surface du virus de 1- hepatite B) , des polyosides 
(pneumocoques) . Des vaccina prepares a partir de peptides 
de synthese ou de micro-organismes genetiquement modifies 
exprimant des antigenes heterologues sont en cours 
d' experimentation. Plus recemment encore, des ADN 
plasmidiques recombines portant des genes codant pour des 
antigenes protecteurs ont etS proposes comme strategie 
vaccinale alternative. Ce type de vaccination est realise 
avec un plasmide particulier derivant d'un plasmide de E. 
coli qui ne se replique pas in vivo et qui code 
uniquement pour la proteine vaccinante. Les principaux 
composants fonctionnels de ce plasmide sont , un promoteur 
fort perraettant 1' expression dans les cellules eucaryotes 
(par exemple celui du CMV) , un site de clonage approprie 
pour inserer le gene d'interet, une sequence de 
terminaison-polyadenylation, une origine de replication 
procaryote pour produire le plasmide recombine in vitro 
et un marqueur de selection (par exemple le g £ ne de 
resistance a 1 -ampicilline) pour faciliter la selection 
des bacteries qui contiennent le plasmide. Des animaux ont 
ete immunises en injectant simplement 1 'ADN plasmidique nu 
dans le muscle. Cette technique conduit a 1- expression de 
la proteine vaccinale in situ et * U ne reponse 
immunitaire en particulier de type cellulaire (CTL) et de 
type humoral (anticorps) . Cette double induction de la 
reponse immunitaire est 1-un des principaux avantages de 
la technique de vaccination avec de 1 'ADN nu. Huygen et 
al. (1996) et Tascon et al . (i 99 6) ont reussi a obtenir 
une certaine protection centre M. tuberculosis en 
injectant des plasmides recombines contenant des genes de 
M. leprae (hsp65, 36kDa pra ) comme inserts. M. leprae 
est I' agent responsable de la lepre. L'utilisation d'un 
xnsert specifique de M. tuberculosis comme par exempli 
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tout ou partie du gene DP428, objet de la presente 
invention conduirait probablement a une meilleure 
protection contre la tuberculose. Tout ou partie du gene 
DP428. ou tout polynucleotide selon 1- invention, pent etre 
facilement insere dans les plasmides vecteurs VU 
(Montgomery et al, 1993), p C DNA3 (Invitrogen, R & D 
Systems) ou pcDNAl/Neo (Invitrogen) qui possedent les 
caracteristiques necessaires pour une utilisation 
vaccinale . 

L' invention vise ainsi un vaccin, caracterisee en ce 
qu-il comprend un ou plusieurs polypeptides selon 
1' invention et/ou un ou plusieurs polypeptides hybrides 
selon 1- invention tels que precedemment definis en 
association avec un vehicule pharmaceutiquement compatible 
et, le cas echeant. un ou plusieurs adjuvants de 
l'immunite appropriSs. 

L ' invention vise aussi une composition vaccinale 
20 destmee a 1 « immunisation de 1'homme ou 1 -animal a 
1'encontre d'une infection bacterienne ou virale. telle que 
la tuberculose ou 1 'hepatite, caracterisee en ce qu-elle 
comprend un ou plusieurs polypeptides hybrides tels que 
precedemment definis en association avec un vehicule 
25 pharmaceutiquement compatible et, le cas echeant, un ou 
plusieurs adjuvants de l'immunite. 

Avantageusement, dans le cas d'une proteine hybride 
entre un polypeptide selon 1- invention et 1'antigene de 

30 surface de 1'hepatite B, la composition vaccinale sera 
administree, chez 1'homme, a raison de 0,1 a 1 m de 
proteine hybride purifiee par kilogramme du poids du 
patxent, de preference 0,2 a 0,5 ,zg/kg de poids du patient, 
pour une dose destinee a une administration donnee. Dans le 

35 cas de patients atteints de troubles du systeme 
xmmunitaire, en particulier les patients immunodeprimes 
chaque dose injectee contiendra pref erentiellement la 
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moitie de la quant ite ponderale de la proteine hybride 
contenue dans une dose destinee a un patient n'etant pas 
affecte de troubles du systeme immunitaire . 

De preference, la composition vaccinale sera 
administree a plusieurs reprises, de maniere etalee dans le 
temps, par voie intradermique ou sous-cutanee . A titre 
d'exemple, trois doses telles que definies ci-dessus seront 
respectivement administrees au patient au temps to, au 
temps to + l mois et au temps to + l an. 

Alternativement, trois doses seront respectivement 
administrees au patient au temps to, au temps to + i mois 
et au temps tO + 6 mois. 



Chez la souris, chez laquelle une dose ponderale de la 
composition vaccinale comparable a la dose utilisee chez 
l'homrae est administree, la reaction anticorps est testee 
par prelevement du serum suivi d'une etude de la formation 
d'un complexe entre les anticorps presents dans le serum et 
20 I'antigene de la composition vaccinale, selon les 
techniques usuelles. 

L' invention concerne egalement une composition 
immunogene caracterisee en ce qu 'elle comprend un 
25 polynucleotide ou un vecteur d< expression selon 
1' invention, en association avec un vehicule permettant son 
administration a l'homme ou 1' animal. 

L' invention a encore pour objet un vaccin destine a 
1- immunisation a l'encontre d'une infection bacterienne ou 
virale, telle que la tuberculose ou 1' hepatite, caracterise 
en ce qu'il comprend un polynucleotide ou un vecteur 
depression selon 1-invention, en association avec un 
vehicule pharmaceutiquement acceptable. 

De telles compositions immunogenes ou vaccinales sont 
notamment..decrites dans la demande Internationale N« wo 
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90/11092 (Vical Inc.) et egalement dans la demande 
Internationale N° wo 95/11307 (institut Pasteur). 

Le polynucleotide constitutif de la composition 
immunogene ou de la composition vaccinale selon 1- invention 
peut etre injects a l'h6te apres avoir ete" couple a des 
composes qui favorisent la penetration de ce polynucleotide 
a l'interieur de la cellule ou son transport jusqu'au noyau 
cellulaire. Les conjugues resultants peuvent Stre 
encapsules dans des microparticules polymeres, comme decrit 
dans la demande internationale N» WO 94/27238 (medisorb 
Technologies International) . 

Selon un autre mode de realisation de la composition 
15 immunogene et/ou vaccinale selon 1> invention, le 
polynucleotide, de preference un ADN, est complexe avec du 
DEAE-dextran (Pagano et al., 1967) ou avec des prolines 
nucleaires (Kaneda et al., 1989), avec des lipides (Feigner 
et al., 1987) ou encore encapsules dans des liposomes 
20 (Fraley et al., I960). 

Selon encore un autre mode de realisation avantageux 
de la composition immunogene et/ou vaccinale selon 
1« invention, le polynucleotide selon 1' invention peut etre 
introduit sous la forme d'un gel facilitant sa transfection 
dans les cellules. Une telle composition sous forme de gel 
peut etre un complexe de poly-L- lysine et de lactose, comme 
decrit par Midoux en 1993, ou encore le Poloxamer 407™, 
comme decrit par Pastore en 1994. Le polynucleotide ou le 
vecteur selon 1' invention peuvent aussi Stre en suspension 
dans une solution tampon ou etre associes a des liposomes. 

Avantageusement, un tel vaccin sera prepare 
conformement a la technique decrite par Tacson et al. ou 
35 Huygen et al . en 1996 ou encore conformement a la technique 
decrite par Davis et al. dans la demande internationale N» 
WO 95/11307 (Whalen et al.). 
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Un tel vaccin sera avantageusement prepare sous la 
forme d'une composition contenant un vecteur selon 
1' invention, placee sous le contr61e d' elements de 
regulation permettant son expression chez 1 • homme ou 
5 1 • animal • 

Pour realiser un tel vaccin, le polynucleotide selon 
1' invention est tout d'abord sous -clone dans un vecteur 
d' expression approprie, plus particuliereraent un vecteur 
10 d- expression contenant des signaux de regulation et 
d- expression reconnus par les enzymes des cellules 
eucaryotes et contenant egalement une origine de 
replication active chez les procaryotes, par exemple chez 
E. coli, qui permet son amplification prealable. Puis le 
plasmide recombinant purifie obtenu est injects a l'hote, 
par exemple par voie intramusculaire . 

On pourra par exemple utiliser, en tant que vecteur 
d' expression in vivo de l'antigene d'intSret, le plasmide 
PCDNA3 ou le plasmide pcDNAl/neo, tous les deux 
commercialises par Invitrogen (R&D Systems, Abingdon, 
Royaume-Uni) . On peut aussi utiliser le plasmide VlJns.tPA] 
decrit par Shiver et al. en 1995. 

Un tel vaccin comprendra avantageusement, outre le 
vecteur recombinant, une solution saline, par exemple une 
25 solution de chlorure de sodium. 

Une composition vaccinale telle que definie ci-dessus sera 
par exemple adrainistree par voie parenteral ou par voie 
intramusculaire. 
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La presente invention concerne egalement un vaccin 
caracterise en ce qu'il contient une ou plusieurs sequences 
nucleotidiques selon 1' invention et/ou un ou plusieurs 
polynucleotides tel que mentionne ci-dessus en association 
avec un v6hicule pharmaceutiquement compatible et, le cas 
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echeant, un ou plusieurs adjuvants de 1- immunity 
appropri£s. 

Un autre aspect porte sur une methode de criblage de 
molecules capables d'inhiber la croissance de mycobacterias 
ou le maintien de mycobacteries dans un hote, caracterisee 
en ce que lesdites molecules bloquent la synthase ou la 
fonction des polypeptides codes par une sequence 
nucleotidique selon l- invention ou par un polynucleotide 
tel que decrit supra. 

Dans ladite methode de criblage, leg molecules peuvent 
Stre des anti-messagers ou peuvent induire la synthese 
d ' ant i -messagers . 

La presente invention viae egalement des molecules 
capables d'inhiber la croissance de mycobacteries ou le 
maintien de mycobacteries dans un hote, caracterisees en ce 
que lesdites molecules sont synthetisees d'apres la 
structure des polypeptides codes par une sequence 
nucleotidique selon !• invention ou par un polynucleotide 
tel que decrit supra. 

D'autres caracterietiques et avantages de 1 • invention 
apparaissent dans les exemples et les figures suivants : 



FIGURES 



30 



La serift dP Figures ],.. 



La serie de Figures l illustre la serie de sequences 
nucleotidiques SEQ ID N°l correspondent a 1- insert du 
vecteur pDP428 (depose a la CNCM sous le M» z . 1Bie) efc 
35 la serie .de sequences d'acides amines SEQ id N°l des 
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polypeptides codes par la serie des sequences 
nucleotidiques SEQ ID N°l. 

Figure 2 : 

Illustre la sequence nucl6otidique SEQ id n°2 
correspondant a la region incluant le gene codant pour 
le polypeptide DP428 (region soulignee) . Sur cette 
figure ont 6t6 pris en compte a la fois les codons ATG 
et GTG d 1 initiation de la traduction. La figure fait 
apparaltre que le polypeptide DP428 fait probablement 
partie d'un operon comprenant au moins trois genes. La 
region doublement encadree inclut probablement les 
regions promotrices . 

La region simplement encadree correspond au motif LPISG 
rapellant le motif LPXTG decrit chez les bacteries a 
Gram positifs comme permettant 1 ' ancrage aux 
peptidoglycannes . 

La serie de FioiirP.g * . 

La serie de Figures 3 represente la serie de sequences 
nucleotidiques SEQ ID N»3 correspondant a 1' insert du 
vecteur p6D7 (depose a la CNCM sous le N° 1-1814). 

La seri e de Figures 4 : 

La serie de Figures 4 represente la serie de sequences 
nucleotidiques SEQ ID N°4 correspondant a 1' insert du 
vecteur p5A3 (depose a la CNCM sous le N» 1-1815. 

La aerie de Fimi raa s . 

La serie de Figures 5 represente la serie de sequences 
nucleotidiques SEQ ID N°5 correspondant a 1 ' insert du 
vecteur p5F6 (depose a la CNCM sous le N° 1-1816) . 
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La sgrift dP F igures 6 : 

La serie de Figures 6 represente la serie de sequences 
nucleotidiques SEQ ID N°6 correspondant a 1 • insert du 
vecteur p2A29 (depose a la CNCM sous le N° 1-1817) . 

La a6rie rif> Figures 7 : 

La serie de Figures 7 represente la serie de sequences 
nucleotidiques SEQ id N°7 correspondant a 1 • insert du 
vecteur p5B5 (depose a la CNCM sous le N« 1-1819) . 

La serig de Figures 8 : 

La serie de Figures 8 represente serie de sequences 
15 nucleotidiques SEQ ID N«8 correspondant a 1 'insert du 
vecteur plC7 (depose a la CNCM sous le N° 1-1820) . 

La serlg Ho Figures ft • 

20 La serie de Figures 9 represente la serie de sequences 
nucleotidiques SEQ ID N°9 correspondant a 1' insert du 
vecteur p2D7 (depose a la CNCM sous le N° 1-1821) . 

La sSrift Ha Fjggrea m • 

25 

La serie de Figures 10 represente la serie de sequences 
nucleotidiques SEQ ID N°10 correspondant a 1- insert du 
vecteur plB7 (depose a la CNCM sous le N° 1-1843) . 

30 La serie de Figure n . 

La serie de Figures 11 represente la serie de sequences 
nucleotidiques SEQ ID N°ll. 



La sgrie rte.Fian™* no . 
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La serie de Figures 12 represente la serie de sequences 
nucieotidiques SEQ ID N°12. 

La serie df » Figure n ■ 

5 

La serie de Figures 13 represente la serie de sequences 
nucieotidiques SEQ ID N°13. 

La a^ri^ P j Q ure ? 1 , 4 • 

10 

La serie de Figures 14 represente la serie de sequences 
nucieotidiques SEQ ID N<>14 correspondant a 1 i insert du 
vecteur p5B5 (depose a la CNCM sous le N<> 1-1819). 



15 



La s£rie de Figures 1£ : 



La serie de Figures 15 represente la serie de sequences 
20 nucieotidiques SEQ ID N°15. 



La serie de Figures ifi 



La serie de Figures 16 represente la serie de sequences 
25 nucieotidiques SEQ ID N°16. 



La serie Figures 17 > 

La serie de Figures 17 represente la serie de sequences 
30 nucieotidiques SEQ ID N°17. 

La serifr H<* Figures 1ft * 

La serie de Figures 18 represente la serie de sequences 
35 nucieotidiques SEQ ID N°18. 



La serie de Figyr^g io 
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La serie de Figures 19 represente la serie de sequences 
nucleotidiques SEQ ID N°19, 

5 La s6rie de Figures 3n , 

La sSrie de Figures 20 represente la serie de sequences 
nucleotidiques SEQ ID N°20 correspondant a !■ insert du 
vecteur p2A29 (depose a la CNCM sous le N° 1-1817). 
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La serie dg Fi gures OA >_ 

La serie de Figures 21 represente la serie de sequences 
nucleotidiques SEQ ID N°2l. 

La serie de Figures *>-> ■ 

La serie de Figures 22 represente la serie de sequences 
nucleotidiques SEQ ID N°22. 

La ser ie de Figures 23 ? 

La serie de Figures 23 represente la serie de sequences 
nucleotidiques SEQ ID N°23. 

La seri e de Figures 24 » 

La serie de Figures 24 represente la serie de sequences 
nucleotidiques SEQ ID N°24. 



Figures 25 et 26 ; 

Les figures 25 et 26 illustrent respectivement les 
sequences SEQ ID N«25 et SEQ ID N°26 representant un 
couple d' amorces utilisees pour amplifier 
35 specifiquement par PCR la region correspondant aux 
nucleotides 964 k 1234 inclus dans la sequence SEQ ID 



WO 99/09186 ^^I7FR98/01813 



68 



5 



SO 



La s6rie de Figures 27 



La s§rie de Figures 27 represente la serie de sequences 
nuclSotidiques SEQ ID N°27 correspondant a 1 ' insert du 
vecteur p5A3 . 



Figure 2S 



La sequence decides amines telle que dSfinie dans la 
figure 28 represente la sequence d'acides amines SEQ ID 
N°28 correspondant au polypeptide DP428. 



15 Figure 2 9 s 

La figure 29 represente la sequence nucleotidique SEQ ID N<> 
2 9 du gene complet codant pour la proline M1C25. 

2" Figure 30 : 

La figure 3 0 represente la sequence d'acides amines SEQ ID 
N° 30 de la proteine M1C25. 

25 La s6ri e de Figures 31, ? 

La sSrie de Figures 31 reprgsente la serie de sequences 
nucl^otidiques SEQ ID N°3l. 

30 La sgrie de Figures 32 ■ 

La serie de Figures 32 represente la serie de sequences 
nuclSotidiques SEQ ID N°32. 



35 La s£ri g de Figures 3 3 
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La sSrie de Figures 33 represente la serie de sequences 
nucleotidiques SEQ ID N°33. 

La serie de Figures 34 ; 

5 

La serie de Figures 32 represent e la serie de sequences 
nucleotidiques SEQ ID N°34. 

serie de Figure ^ ■ 

10 

La serie de Figures 35 represente la serie de sequences 
nucleotidiques SEQ ID N°35. 



La s6rie Hp P jgures 36 ? 

La serie de Figures 36 represente la serie de sequences 
nucleotidiques SEQ ID N°36. 

20 

La serie d<* Figures 37 = 

La serie de Figures 37 represente la serie de sequences 
nucleotidiques SEQ ID N°37. 

La serie H e Figures ifl ■ 

La serie de Figures 38 represente la serie de sequences 
nucleotidiques SEQ ID N°38. 

30 

La serie de Ejguj^a ™ ■ 

La s6rie de Figures 39 represente la serie de sequences 
nucleotidiques SEQ ID N°39. 

35 

La serie de Figures 40 ■ 
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La s^rie de Figures 40 represente la sSrie de sequences 
nuclgotidiques SEQ ID N°40. 

La s^rie Figures 41 » 

5 

La sSrie de Figures 41 represente la s^rie de sequences 
nucl£otidiques SEQ ID N°41 correspondant a 1 ' insert du 
vecteur p2D7 (d£pos£ a la CNCM sous le N«I-1821) . 

10 La s£ri e de Figures 42 ; 

La sSrie de Figures 42 represente la serie de sequences 
nucl£otidiques SEQ ID N°42. 



15 



La s£ri e de Figures 4 3 r 



La s£rie de Figures 43 represente la s6rie de sequences 
20 nucl£otidiques SEQ ID N°43. 



La s^rifi rtA Figures ^4 . 

La s£rie de Figures 44 represente la sgrie de sequences 
25 nucl£otidiques SEQ ID N°44* 

La serie Hp> Figures 4q . 

La sSrie de Figures 45 represente la s6rie de sequences 
30 nucleotidiques SEQ ID N°45. 

La seriA Figures 4fi . 

La sSrie de Figures 46 represente la serie de sequences 
35 nucleotidiques SEQ ID N°46. 



La seri e de Fi g ures 47 



WO 99/09186 




7FR98/01813 



La s§rie de Figures 4 7 reprSsente la sSrie de sequences 
nuclgotidiques SEQ ID N°47. 

5 La s£ri e de F^aureg 4fl : 

La sSrie de Figures 48 repr^sente la sSrie de sequences 
nuclSotidiques SEQ ID N°48. 

10 La seri e de Figures 4 9 : 

La sSrie de Figures 4 9 reprSsente la serie de sequences 
nuclSotidiques SEQ ID N°4 9. 
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La s£rie de Figure . 

La s6rie de Figures 50 represente la serie de sequences 
nucleotidiques SEQ ID N°50. 

Figure 51 : 

A. la construction pJVED: Plasmid navette ( pouvant se 
multiplier chez les mycobactSries ainsi que chez 
E.coll). avec un gene de resistance a la kanamycine 
(issu de Txi903) comme marqueur de selection. Le gene 
phoA tronqu6<A phoA) et le gdne luc forment un opSron 
synthetique, 

B. Sequence de la jonction entre phoA et luc. 
Figure 51 : 

Hybridation gSnomique {Southern blot) de I'ADN 
genomique de dif£6rentes esp&ces mycobactgriennes a 
l'aide d'une sonde oligonuclSotidique dont la sequence 
est la .sequence comprise entre le nucleotide en 



! 
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position nt 964 (extremite 5 • de la sonde) et le 
nucleotide en position nt 1234 (extremite 3- de la 
sonde), extremites indues, de la sequence SEQ id N'i . 

5 Figures SI *r . 

Activity Luc et PhoA de M. smegnatis recombinant 
contenant le pJVED avec different* fragments 
nucleotidiques comme decrits en exemple. Les figures 52 
I" et 53 representent les resultats obtenus pour deux 
expSnences distinctes realisees dans les memes 
conditions. 
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Figure 55 



Representation de 1 - hydrophobic!^ (Kyte et Doolitle) 
de la sequence codante du polypeptide DP428 avec sa 
representation schematise. Le motif LPISG precede 
immediatement la region C-terminale hydrophobe. La 
sequence se termine par deux arginir 



Lnes . 



Figure 5fi . 

Representation de 1 • hydrophoicite (Kyte et Doolitle) de 
la sequence du polypeptide M1C2S de sequence d'acides 
amines SEQ ID N° 30. 

Figure 57 • 



A- Gel d'acrylamide (12%) en condition denaturante d'un 
extrait bacterien obtenu par sonication de bacteries E. 
coli Mis contenant le plasmide P M1C25 sans et apres 4 
heures d- induction par l'IPTG, colore au bleu de 
35 Comassie . 
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ligne I; Marqueur de masse molaire (Prestained SDS-PAGE 
Standards High Range DIO-RAD(r/>). 

ligne 2: Extrait bacterien obtenu par sonication de 
bacteries E. coli M15 contenant le plasraide P M1C2 5 
sans induction par I'IPTG. 

ligne 3: Extrait bacterien obtenu par sonication de 
bacteries E. coli M15 contenant le plasmide P M1C25 
apres 4 heures d' induction par I'IPTG. 

ligne 4.- Marqueur de masse molaire (Prestained SDS-PAGE 
Standards Low Range BIO- RAD®) . 



B- Western blot d'un gel semblable gel (acrylamide 12%) 
revele grace a l'anticorps penta-His commercialise par la 
society Quiagen. 

ligne l: representation du marqueur de masse molaire 
(Prestained SDS-PAGE Standards High Range 1UQ-RAIX?/)). 



ligne 2: extrait bacterien obtenu par sonication de 
bacteries E. coli MIS contenant le plasmide P M1C25 
25 sans induction par I'IPTG. 

ligne 3: extrait bacterien obtenu par sonication de 
bacteries E. coli M15 contenant le plasmide P M1C25 
apres 4 heures d' induction par I'IPTG. 



ligne 4: representation du marqueur de masse molaire 
(Prestained SDS-PAGE Standards Low Range BIO-RAD®) 

La bande presente tres majoritairement dans les lignes 
correspondant aux bacteries induites par I'IPTG par rapport 
a celles-non induites par 1-iptg, comprise entre 34200 et 
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28400 daltons, correspond a 1- expression de 1 ' insert M1C25 
clone dans le vecteur pQE-60 (Qiagen®) . 



En ce qui concerne les legendes des autres figures qui 
sent numerotees par un caractere alphanumerique, chacune de 
ces autres figures represente la sequence nucleotidique et 
la sequence d'acides amines de sequence SEQ id dont la 
numeration est identique au caractere alphanumerique de 
chacune desdites figures. 

Les numerotations alphanum6riques des figures 
representant les SEQ ID comportant un nombre suivi d'une 
lettre ont les significations suivantes : 

- les numerotations alphanumeriques presentant le meme 
nombre concernent une meme famille de sequence rattachees a 
la sequence de reference SEQ id dont la numeration 
presente ce meme nombre et la lettre A ; 

- les lettres A, B et C pour une meme famille de sequences 
distinguent les trois phases de lecture possibles de la 
sequence nucleotidique SEQ ID de reference (A) ; 

- les lettres indexees par un prime (•) signif'ient que la 
sequence correspond a un fragment de la sequence SEQ ID de 
reference (A) ; 

- la lettre D signifie que la sequence correspond a la 
25 sequence du gdne predit par Cole et al., 1998 ; 

- la lettre P signifie que la sequence correspond a la 
Phase ouverte de lecture (ORF pour "Open Reading Frame") 
contenant la sequence «D« correspondante d'apres Cole et 
al., 1998 ; 

- la lettre G signifie que la sequence est une sequence 
predite par Cole et al., 1998, et presentant une homologie 
de plus de 70% avec la sequence SEQ ID de reference (A) , 

- la lettre H signifie que la sequence correspond a ' la 
phase ouverte de lecture contenant la sequence "G" 
correspondante d'apres Cole et al., 1998 ; 

- la lettre R signifie que la sequence correspond a une 
sequence predite par Cole et al., 1998, en amont de la 
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sequence "D» correspondante et pouvant §tre en phase avec 
la sequence «<D» en raison d'erreurs de s£quen 9 age 
possibles ; 

- la lettre P signifie que la sequence correspond a la 
phase ouverte de lecture contenant la sequence »R» 
correspondante ; 

- la lettre Q signifie que la sequence correspond a une 
sequence contenant les sequences " F" et " P » 
correspondantes . 

En ce qui concerne la famille de sequences SEQ ID N° 
4, 1- insert precedent phoA contient deux fragments non 
contigus sur le genome, SEQ ID 4J et SEQ ID 4A, et done 
issus d'un clonage multiple permettant 1 -expression et 
1 'exportation de phoA. Ces deux fragments non contigus, les 
gSnes et les phases ouvertes de lecture qui les contiennent 
d'apres Cole et al . , i 998 , sont importants pour 
1 • exportation d'un polypeptide antigene : 

- les lettres J, K et L distinguent les trois phases de 
lecture possibles de la sequence nucleotidique -j« 
correspondante ; 

- la lettre M signifie que la sequence correspond a la 
sequence predite par Cole et al., 1998 , et contenant la 
sequence SEQ ID N° 4J ; 

- la lettre N signifie que la sequence correspond a la 
phase ouverte de lecture contenant la sequence SEQ id n« 
4M. 

En ce qui concerne la famille de sequences SEQ ID 
N« 45, la lettre Z signifie que la sequence correspond a la 
sequence d'un fragment clone fusionne avec phoA. 

Enfin, en ce qui concerne la famille de sequence SEQ 
ID No 41, la lettre S signifie que la sequence correspond a 
une sequence predite par Cole et al., i 99Q et pouvant Stre 
dans la mSme phase de lecture que la sequence »D» 
correspondante, la lettre T signifiant que la sequence 
35 correspondante contient les sequences « F « et «s» 
correspondantes. 
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EXEMPLES 

Materiel et methodes 



5 Cultures bacteriennes, plasmides et milieux de cultures 

E. coli a ete cultive sur milieu liquide ou solide Luria- 
Bertani (LB) . M. amegmatia a ete cultive sur milieu liquide 
Middlebrook 7H9 (Difco) additionne de dextrose albumine 

•0 (ADC) , 0/2 % de glycerol et 0,05 % de Tween, ou sur milieu 
solide L . Si necessaire, 1 'antibiotique kanamycine a ete 
rajoute a une concentration de 20 „g/ml- 1. Les clones 
bacteriens presentant une activite PhoA ont ete detectes 
sur de l'agar LB contenant du s-bromo-4 -chloro-3-indolyle 

15 phosphate (X-P, a 40 fig/ml' 1) . 

Manipulation d'ADN et sequencage 

Les manipulations d'ADN et les analyses par 
20 Southern blot ont ete effectuees en utilisant les 
techniques standard (Sambrook et al . , 1989). Les sequences 
d'ADN double brun ont ete determines avec un kit de 
sequencage Taq Dye Deoxy Terminator Cycle (Applied 
Biosystems), dans un Systeme 9600 GeneAmp PGR (Perkin- 
25 Elmer), et apres migration sur un systeme d> analyse ADN 
modele 373 (Applied Biosystems) . 

Constructions des plasmides 

3 « Le plasmide pJVED a a ete construit a partir de 

PLA71, plasmide de transfert comportant le gene phoA 
tronque et place en phase avec BlaF . pLA71 a ete coupe avec 
les enzymes de restriction Kpnl et AfotI, retirant ainsi 
phoA sans toucher le promoteur de BlaF. Le gene 2uc codant 

35 pour la luciferase de luciole a ete amplify a partir de 
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PGEM-Iuc et un site de liaison du ribosome a ete rajoute. 
phoA a ete amplify a partir de pJEMll. Les fragments 
amplifies ont ete coupes avec Psti et ligatures ensemble. 
Les oligodeoxynucleotides utilises sont les suivants : 
pPV.luc.Fw : 5 ' GACTGCTGCAGAAGGAGAAGATCCAAATGG3 ' 
luc . Bw : 5 1 GACTAGCGGCCGCGAATTCGTCGACCTCCGAGG3 > 
pJEM.phoA.Fw : S 1 CCGCGGATCCGGATACGTAC3 ' 
phoA . Bw : 5 ' GACTGCTGCAGTTTATTTCAGCCCCAGAGCG3 • . 

Le fragment ainsi obtenu a ete reamplifie en 
utilxsant les oligonucleotides complementaires de ses 
extremites, cou P 6 avec Kpnl et Afotl, et integre dans P LA7l 
coupe avec les memes enzymes. La construction resultante a 
6te electroporee dans E. coli DHScc et M. smegmatis m C 2 155. 
Un clone M. smegma tia emettant de la lumiere et presentant 
une activite phoA a ete selectionne et appele pJVED/blaF. 
L 1 insert a ete retire en utilisant BamHI et la construction 
referm6e sur elle-meme, reconstruisant ainsi le P JVED a 
Afin d'obtenir le pJVED b ,c, le multisite de clonage a ete 
coupe avec Seal et Kpnl et referme en enlevant un (pJVED b ) 
ou deux (pJVEDc) nucleotides du site SnaBI. Apres fusion 
six cadres de lecture ont pu ainsi etre obtenus. L' insert 
du pJVED/hsplfi a ete obtenu par amplification en chalne par 
polymerase (ACP) de pPM1745 (Servant et al., 1995, en 
utilisant des oligonucleotides de la sequence : 
25 18.FW : 5 1 GTACCAGTACTGATCACCCGTCTCCCGCAC3 1 
18. Back : AGTCAGGTACCTCGCGGAAGGGGTCAGTGCG3 ' 

Le produit a ete coupe avec iCpnl et Seal, et 
ligature a pJVED a , coupe avec les memes enzymes, quittant 
ainsi le pJVED/hsplfl. 
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Le pJVBD/PWJcD. et le pJVED/erp furent construits en 
coupant avec Bai^I 1 ■ insert de P Ex P 410 et pE xp53 
respectivement, et en les inserant dans le site BamHI du 
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multisite de clonage de pJVED a . 
Mesure de l'activite phosphatase alkaline 

La presence d'activite est detectee par la couleur 
bleue des colonies croissant sur un milieu de culture 
contenant le substrat 5-bromo 4-chloro 3-indolyl phosphate 
(XP), puis l'activite peut etre mesuree quantitativement de 
maniere plus precise de la facon suivante : 

M. smegmatis ont ete cultives dans un milieu LB 
additionnes de 0,05 % de Tween 80 (Aldrich) et de 
kanamycine (20 /xg/ml- 1, 4 37 o C pen dant 24 heures. 
L'activite de la phosphatase alkaline a Ste mesuree par la 
methode de Brockman et Heppel (Brockman et al . . 1968) dans 
un extrait sonique, avec p-nitrophenylphosphate comme 
substrat de la reaction. La quantit6 de prolines a ete 
mesuree par essai Bio-Rad. L'activite phosphatase alkaline 
est exprimee en unite arbitraire (densite optique a 420 nm 
x fig de proteines- 1 x minutes- 1) . 

Mesure de l'activite lucif erase 
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W. smegmatis a ete cultive dans un milieu LB 
additions de 0,05 % de Tween 80 (Aldrich) et de kanamycine 
(20 jig/ml- 1) a 37o C pendant 24 heures et utilise en pleine 
croissance exponentielle (DO a 600 nm comprise entre 0,3 et 
0,8). Les aliquots de suspensions bacteriennes ont ete 
brievement soniques et 1 'extrait cellulaire a ete utilise 
pour mesurer l'activite de la lucif erase. 25 M l de 
1' extrait sonique ont ete melanges avec 100 M l de substrat 
(systeme d'essai luciferase Promega) automat iquement dans 
un luminometre et la lumiere emise exprimee en ULR ou RLU 
(Unites Lumineuses Relatives). Les bacteries ont ete 
cotnptees par dilutions serielles de la suspension d'origine 
sur milieu agar LB kanamycine et l'activite de la 
luciferase exprimee en ULR/^g de proteines bacteriennes ou 
en ULR/103 bacteries. 
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Construction de banques gSnomiques de M. tuberculosis et 
de M. bovis-BCG 



Les banques ont ete obtenues en utilisant 
essentiellement pJVED a , b ,c precedemment decrits. 

Preparation de macrophages issus de la moelle osseuse et 
infection par M. smegmatis recombinants 



Les macrophages issus de la moelle osseuse ont ete 
prepares comme decrits par Lang et al., „ 91 . En resU(n6< 
les cellules de la moelle osseuse ont ete preleves du femur 
de souris CS7BL/6 agee de 6 a 12 semaines (Iffa-Credo, 

W France) . Les cellules en suspensions ont ete lavees et 
resuspendues dans du DMEM enrichi avec 10 % de serum foetal 
de veau, io % de milieu L-cell conditionne et 2 mM de 
glutamine, sans antibiotiques . 106 cellules ont ete 
ensemencees sur des plaques 24 puits Costar a fond plat 

2« dans 1 ml. Apres quatre jours a 37*c dans une atmosphere 
humxde a 10 % de teneur en C02, les macrophages ont ete 
nnces et rSincubes pendant deux a quatre jours 
supplemental^. Les cellules d-un puits controle ont ete 
lysees avec du triton x 100 a 0,1 % dans 1-eau et les 

25 noyaux enumeres. Environ 5 x i 0 5 cell ules adherentes ont 
ete comptees. Pour 1' infection, M. smegmatis portant les 
differents plasmides a ete cultive en pl eine phase 
exponentielle (DO 600nm entre 0,4 et 0,8) et dilue jusqu'a 

10 Til 0 I'" 10 f ° iS Un miUeU P° ur -crophage. 

cent a '° Ut " * ChaqUS PUitS 6t 163 Pla ^ es ont ete 

centr.fugees et incubees quatre heures a 37-C. Apres trois 

err 3 '/,"' 61111168 ° Dt inCUb * 6S danS - 

contenant de l-amykacine pendant deux heures. Apres trois 

incubees dans un milieu macrophage pendant une nuit. Les 
cellules ont ensuite ete lysees dans 0,5 ml de tampon de 
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lyse (Promega) . 100 „l ont ete soniques et la lumiere emise 
a ete mesuree sur 25 „m. Simultanement, les bactSries ont 
ete enumerees par etalement sur L-agar-kanamycine (20 
Mg/ml" 1). La lumiere emise est exprimee en OLR/103 
5 bacteries . 

Analyses des banques de donnees 
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Les sequences nucleotidiques ont ete comparees a 
EMBL et GenBank en utilisant I'algorithme PASTA et les 
sequences protelques ont ete analyses par similitude 
grace aux banques de donnees PIR et Swiss Prot en utilisant 
I'algorithme BLAST . 

Exemple 1 : Les vecteurs pJVEb 

Les vecteurs pJVED (Figure 51) sont des plasmides 
portant un gene phoA tronque de B . coli depourvu de codon 
d- initiation, de sequence signal et de sequence 
regulatrice. Le site multiple de clonage (SMC) permet 
1' insertion de fragments des genes codants pour 
d'eventuelles prolines exportees ainsi que leurs sequences 
de regulation. Des lors, la proteine de fusion peut etre 
produite et presenter une activite phosphatase alcaline si 
elle est exportee . Seules les fusions en phase pourront 
etre productives. Ainsi, le SMC a ete modifie de sorte que 
les fusions peuvent Stre obtenues dans six phases de 
lecture. En aval de phoA, le gene luc de la lucif erase de 
luciole a et€ insere. Le gene complet avec le codon 
d< initiation mais sans qu'aucun promoteur n'ait etS utilise 
devrait ainsi s'exprimer avec phoA comme dans un operon 
synthetique. Un nouveau site de liaison des ribosomes a ete 
insere huit nucleotides en amont du codon d- initiation de 
luc. Deux terminateurs transcript ionnels sont presents dans 
les vecteurs pJVED, un en amont du SMC et un second en aval 
de luc. Ces vecteurs sont des plasmides de transfert E. 
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coli -mycobacteria avec un gene de resistance a la 
kanamycine comme marqueur de selection. 

phoA et luc fonctionnent comme dans un opSron, mais 
5 1 'exportation est ntcessaire pour 1'activitS phoA. 

Quatre plasmides ont ete construits par insertion 
dans le SMC de fragments d'ADN d'origine diverse : 

Dans la premiere construction nommee pJVED/blaF, le 
fragment de 1,4 kb provient du plasmide deja decrit pum 
10 (Li- et al., 1995). Ce fragment issu du gene P -lactamase 
(blaF) de M. fortuitum D216 (Timm et al., 1994) inclut le 
promoteur mute hyperactif, le segment codant pour 32 acides 
amines de la sequence signal et les 5 premiers acides 
amines de la proteine mature. Ainsi cette construction 
inclut le promoteur le plus fort connu chez mycobacterium 
et les dements necessaires a 1 < exportation de la proteine 
de la fusion phoA. Par consequent, on peut attendre de 
cette construction une forte emission de lumiere et une 
bonne activite phoA (cf figures 53 et 54) . 

2<> Dans une deu *ieme construction nommee pJVED/hsplS 

un fragment de 1,5 kb a ete clone a partir du plasmide de ja 
decrxt PPM1745 (Servant et al., 1995,. Ce fragment inclut 
les nucleotides codants pour les dix premiers acides amines 
de la proteine de choc thermique de 18 kb issue de 

25 Strepto/nyces albus (heat shock protein 18, HSP 18), le site 
de liaison du ribosome, le promoteur et, en amont, des 
sites regulateurs contrdlant son expression. Cette proteine 
appartient a la famille de alpha- crystal line de HSP , 
faible poids moieculaire (Verbon et al., 1992) . Son 

30 homologue issu de M. leprae, 1'antigene de 18 kDa, est deja 
connu pour etre induit durant la phagocytose par un 
macrophage murin de la l ign ee cellulaire j-774 
(Dellagostinet al., 1995). Dans des conditions de culture 
standard, le pJVED/hspia, montre une faible activite luc et 

35 aucune activite phoA (cf figures 53 et 54) . 
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Dans une troisi^me construction, nommee 
pJVBD/PWfcfti. I- insert issu de P Exp410 (Lim et al„ 1995) a 
«t« coupe et clone dans le SMC de pJV ED a . Ce fragment 
xnclut les nucleotides codants pour les 134 premiers acides 
amines de la proteine connue de W. tuberculosis 19 kDa et 
de ses sequences regulatrices . Comme cela a pu etre mis en 
Evidence, cette proteine est une lipoproteine glycosylee 
(Garbe et al., 1993 ; Herrmann et al., i 9 96) . Sur les 
figures 53 et 54. on observe, pour cette construction, une 
bonne activite iuc correspondant a un promoteur fort, mais 
1' activite phoA est la plus forte des quatre constructions 
L-activite pkoA elevee de cette proteine de fusion avec une 
lipoproteine s'explique par le fait qu'elle reste attachee 
a la paroi cellulaire par son extremite N-terminal 

03113 ^ qUatridme 6t derni * re construction nommee 
pJVED/erp 1- insert provient de P Exp53 (Lim et al . . 1995) et 

a ete clone dans le SMC de P JVED a . P Exp53 est le plasmide 
initial selectionne pour son activite phoA et contenant une 
partie du gene erp de M. tuberculosis qui code pour un 
antigene de 28 kDa. Ce dernier inclut la sequence signal, 
une partie de la proteine mature et. en amont du codon 
d initiation, le site de liaison de ribosome. Le promoteur 
a ete cartographie. Une boite fer (iron box) putative du 
type fur estpresente dans cette r6gion et encadre la 
region -35 du promoteur (Berthet et al . , 1995). Comme 
prevu (figures 53 et 54) cette construction presente une 
bonne emission lumineuse et une bonne activite phoA Le 
fait que cette proteine de fusion, contrairement a la 
fusion avec la lipoproteine de 19 kDa, ne semble pas 
attachee a la paroi cellulaire n'exclut pas que la proteine 
native y soit associee. De plus, 1-extremitS C- terminal de 
erp est absente de la proteine de fusion. 

Exemple 2 , Construction d-une banque d ' ADN genomique de 
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M. tuberculosis dans les vecteurs pJVED s et identification 
d'un des membres de ces banques, (DP428) , induit au cours 
de la phagocytose par les macrophages murins derives de la 
moelle osseuse. 

Les differentes constructions sont testees pour 
leur capacite a evaluer 1' expression intracellulaire des 
g&nes identifies par 1 -expression de phoA. Dans cet 
objectif, 1 -activity luc est exprimee en URL pour 103 
bacteries en culture axenique et/ou dans des conditions 
intracellulars. L' induction ou la repression suivant la 
phagocytose par les macrophages murins derives de la moelle 
osseuse peut etre evaluee convenablement par la mesure des 
activites specif iques. Les resultats de deux experiences 
distinctes sont presentes dans le tableau 2. 
'5 Le plasmide pJVED/hsplS a ete utilise comme 

contrdle positif pour 1- induction durant la phase de 
croissance intracellulaire. Bien que 1- induction du 
promoteur par le chauffage de la bacterie a 42'C n'ait pas 
6te concluant la phagocytose de la bact6rie conduit 
clairement a une augmentation de l'activite du promoteur. 
Dans toutes les experiences, 1-activite luc intracellulaire 
a ete fortement induite, augmentant de 20 a ioo fois 
l'activite basale initialement faible (Servant, 1995). 

Le plasmide pJVED/MaP a 6te utilise comme contr61e 
de la modulation non specifique au cours de la phagocytose 
De faibles variations ont pu etre mises en evidence' 
probablement dues a des changements de conditions de 
cultures. Quoi qu'il en soit, ces faibles variations ne 
sont pas comparables a 1- induction observee avec le 
30 plasmide pJVED/hsplS. 

Tous les membres de la banque d'ADN ont ete testes 
par mesure de l'activite du promoteur durant la croissance 
intracellulaire . Parmi eux, le DP428 est fortement induit 
au cours de la phagocytose (tableaux i et 2). 
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TABLEAU 1 



Construction 



pJVED/A/q/ 



pJVBD/fagM 



Construction 



p)VED/hlaF 



pJVED//» w M 



PJVED/D/V2&' 



% Recuperation 



0.5 



0,6 



0.7 



% Recuperation 
CS7BL/6 Balb/C 



7 

6.7 



y 

1.7 



1,6 



2.1 



URL/10 3 
bactcrics 
cxtraccllulairc 



1460 



8 



0.O6 



URL/10- 1 
bactcrics 
extracellulairc 



URL/ 10* 
bactcrics 
intraccllulairc 



1727 



Induction 



57 



18 



662 



164 



0,08 



URL/10 1 
bactcrics 
intraccllulairc 
C57BL/6 Balb/C 



250 



9ll 



26! 



325 



I.25 



3.3 



1 ,2 



1L 



300 



Induction 
C57BL/6 Balb/C 



0,4 



1.6 



1,4 
2 



15.6 



41 



5 TABLEAU 2 



Construction 


% Recuperation 


URL/10 1 


URL/10 1 


Induction 






bactcrics 


bactcrics 


pJVED/A/a/^ 


22 


extracellulairc 
1477 


intraccllulairc 




pJVED/hs P J8 
pJVED//)/V25 


7 
21 


0.26 
0,14 


367 

6.8 1 
4 


0,25 
26 
[28 



10 



15 



Le fragment nucleotidique codant pour la region N- 
terminale du polypeptide DP428 de sequence SEQ ID N» 28 est 
contenu dans le plasmide depose a la CNCM sous le N° 1- 
1818. 

La totalite de la sequence codant pour le polypeptide 
DP428 a ete obtenue comrae detaillee ci-apres. 

Une sonde a ete obtenue par PCR a l'aide des 
oligonucleotides de sequence SEQ ID N" 25 et SEQ ID N«> 26 
Cette sonde a ete marquee par extension aleatoire en 
presence de »P dCTP. Une hybridation de 1 1 ADN genomique de 
M. tuberculosis souche Mtl03 prealablement digere par 
l'endonuclease Seal a ete realisee a Wide de ladite 
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sonde. Les resultats de 1 • hybridation ont fait apparaitre 
qu'un fragment d ' ADN d'environ 1,7 kb etait marque. Du fait 
qu-il existe un site Seal s'etendant du nucleotide nt 984 
au nucleotide nt 989 de la sequence SEQ ID N° l e'est-a 
5 dire du cote 5 ■ de la sequence utilisee comme sonde, la fin 
de la sequence codante est necessairement presente dans le 
fragment detecte par hybridation. 

L'ADN genomique de la souche Mt 103 de m. 
tuberculosis, apres digestion par Seal, a subi une 
10 migration sur un gel d' agarose. Les fragments de tallies 
comprises entre 1,6 et 1,8 kb ont ete clones dans le 
vecteur pSL1180 (Pharmacia) prealablement clive par Seal et 
dephosphoryle. Apres transformation de E. coli avec les 
vecteurs recombinants resultants, les colonies obtenues ont 
15 M criblees a 1'aide de la sonde. Le criblage a permis 
d isoler six colonies hybridant avec cette sonde. 

Les inserts contenus dans les plasmides des clones 
recombinants precedemment selectionnes ont ete sequences 
puis les sequences alignees de maniere a determiner la 
20 totalite de la sequence codant pour DP428, plus 
specif iquement la SEQ ID N° 2 . 

Un couple d'amorces a ete synthetise afin d'amplifier 
a partir de 1 'ADN genomique de M. tuberculosis, souche Mt 
103, la totalite de la sequence codant pour le polypeptide 
2S DP428. L'amplicon obtenu a ete clone dans un Vecteur 
a 'expression. 

Des couples d'amorces appropries pour 1 ■ amplification 
dp«« Cl ° nage / e 13 S ^ uence ««>ant pour le polypeptide 
DP428 peuvent etre aisement realises par 1'homme du metier, 

1^2 13386 S6qUenCeS nucl6 °tidiques SEQ ID N»l et SEQ 

Un couple d'amorces particulier selon 1- invention est 
le couple d'amorces suivants, capable d'amplifier 1-ADN 
codant pour le polypeptide DP428 depourvu de sa s6quence 
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- Amorce aller {SEQ id N<> 29 , , comprenant la sequence 
allant du nucleotide en position nt 1021 au nucleotide nt 
1044 de la sequence SEQ ID N° 2 : 
5' -AGTGCA TGCTGCTGC3CCgAACCATCAGrr!Ar - 



3' 



- Amorce retour (SEQ ID N° 30), comprenant la sequence 
compiementaire de la sequence allant du nucleotide en 
position nt 1345 au nucleotide en position nt 1325 de la 
sequence SEQ ID N° 2 : 

5' -CAGCCAGATCTGCGGGCGrfTfTGCACCGPrTa. 31 f 

dans lesquelles la partie soulignee represent les 
sequences hybridant specif iquement avec la sequence SEQ ID 
N° 2 et les extremities 5> correspondent a des sites de 
restriction en vue du clonage de 1-amplicon resultant dans 
un vecteur de clonage et/ou d- expression. 

Un vecteur particulier utilise pour 1 -expression du 
polypeptide DP428 est le vecteur p QE 70 commercialise par la 
societe Qiagen. 

Example 3 : La sequence complete du gene DP 42 8 et de ses 
regions flanquantes. 

Une sonde de la region codante de DP428 a ete 
obtenue par ACP, et utilisee pour hybrider 1-ADN ginomique 
de dxfferentes especes de mycobacteries. D-apres les 
resultats de la figure 3, U gene est present uniquement 
dans les mycobacteries du complexe de M. tuberculosis. 

L 1 analyse de la sequence suggere que DP428 pourrait 
faxre partie d'un operon. La sequence codante et les 
rjgxons flanquantes ne presentent aucune homologie avec des 
sequences connues deposees dans les banques de donnees. 

nr , & . D ' apr6S 13 S6quence codant *' ce gene code pour une 
protexne de 10 kDa avec un peptide signal, une extremite C- 
terminal hydrophobe terminee par deux arginines et precedee 
par un motif LPISG semblable au motif connu LPXTG . Ces deux 
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arginines pourraient corresponds a un signal de retention 
et la proline DP428 pourrait etre accrochee par ce motif a 
des peptidoglycanes comme cela a dSja €te decrit chez 
d'autres bacteries Gram' (Navarre et al . , 1994 e t 1996). 

Le mecanisme de survie et de croissance 
intracellulaire des mycobacteries est complexe et l es 
relations intimes entre la bacterie et la cellule hote 
restent inexpliquees. Quel que soit le mecanisme, la 
croissance et la survie intracellulaire des mycrobact6ries 
depend de facteurs produits par la bacterie et capables de 
moduler la reponse de 1-hSte. Ces facteurs peuvent etre des 
molecules exposees a la surface cellulaire telle que LAM ou 
des prolines associees a la surface cellulaire, ou des 
molecules activement secrStees. 

D'un autre cdte, intracellulairement, les bacteries 
elles-memes doivent faire face a un environnement hostile. 
El les semblent y repondre par des moyens proches de ceux 
mis en oeuvre dans les conditions de stress, par 
1' induction de prolines de choc thermique (Dellagostin et 
al., 1995), mais aussi par induction ou la repression de 
differentes proteines (Lee et al., 1995). En utilisant une 
methodologie derivee de la PCR, Plum et Clark-curtiss (Plum 
et al., 1994) ont montre qu'un gene de M. avium inclu dans 
un fragment d'ADN de 3 kb, est induit apres la phagocytose 
par des macrophages humains. Ce gene code pour une protSine 
exportee comprenant une sequence leader mais ne presentant 
pas d'homologie significative avec les sequences proposees 
par les banques de donnees. L- induction, pendant la phase 
de croissance intracellulaire, d'une proline de choc 
thermique de faible poids moleculaire issue de M. leprae a 
egalement et<§ mise en evidence (Dellagostin et al., 1995) 
Dans une autre etude, les prolines bacteriennes de M. 
tuberculosis ont ete metaboliquement marquees pendant la 
phase de croissance intracellulaire ou bien dans des 
conditions de stress et separees par electrophorese sur gel 
a deux dimensions : 16 proteines de M. tuberculosis ont ete 
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induites et 28 reprimees. Les memes proteines sont mises en 
jeu au cours de stress provoque par un faible pH, un choc 
thermique, H 2 0 2 , ou au cours de la phagocytose par des 
monocytes humains de la lignee THP1 . Quoi qu'il en soit, le 
comportement des proteines induites et reprimees etait 
unique dans chaque condition (Lee et al . , 1995). Pris 
ensemble, ces resultats indiquent qu'un dialogue 
moleculaire subtile est mis en place entre les bacteries et 
leurs hotes cellulaires. De ce dialogue depend probablement 
le sort de l'organisme intracellulaire. 

Dans ce contexte, 1- induction de 1« expression de 
DP428 pourrait etre d'une importance majeure, indiquant un 
role important de cette proteine dans la survie et la 
croissance intracellulaire. 

La methode utilisee dans ces experiences pour 
evaluer 1- expression intracellulaire des genes (cf. Jacobs 
et al.. 1993, pour la m6thode de determination de 
1 'expression de la luciferase de luciole, et Lim et al 
1995, pour la methode de determination de 1- expression du 
gene PhoA) presente 1 • avantage d'etre simple comparee aux 
autres techniques comme la technique d6crite par Mahan et 
al. (Mahan et al . , 1993) adaptee aux mycobacteries et 
proposee par Bange et al . (Bange et al . , 1996), ou la 
methode substractive basee sur l'ACP decrite par Plum et 
25 Clark-curtiss (Plum et al., 1994). u existe 
indiscutablement une variabilis comme le montre la 
comparison des differentes experiences. Bien que provoquer 
1' induction ou la repression soit suffiaant, il est 
desormais possible de 1- evaluer fournissant ainsi un outil 
30 supplemental^ d'etudes physiologiques des proteines 
exportees identifiees par fusion avec phoA. 



20 



Example 4 



35 



Recherche d-une modulation de 1' activity des promoteurs 
lors des phases intramacrophagiques . 
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Des macrophages de moelle osseuse de souris sent 
prepares comme decrit par Lang et Antoine (Lang et al., 
1991). Les bacteries de M. segmentis recombinantes, dont on 
a determine 1' activity lucif erase par 10 3 bacteries comme 
precedemment, sont incubees a 37°c sous atmosphere 
humidifiee et enrichie en C0 2 a 5%, pendant 4 heures en 
presence de ces macrophages de telle maniere qu'elles 
soient phagocytees. Apres rinqrage pour eliminer les 
bact6ries extracellulaires restantes, on ajoute au milieu 
de culture de l'amikacine (100 M g/ml) pendant deux heures. 
Apres un nouveau rincage, le milieu est remplace par un 
mUieu de culture (DMEM enrichi de 10 % de serum de veau et 
2 mM de glutamine) sans antibiotiques . Apres une nuit 
d' incubation comme pr6cedemment , les macrophages sont lyses 
15 a froid <4'C) a 1'aide d'un tampon de lyse (cee lysis 
buffer, Promega), et l'activite luciferase par 10 3 
bacteries determinee. Le rapport des activites a la mise en 
culture et apres une nuit donne le coefficient d' induction. 

20 Exemple 5 j 

isolement d-une serie de sequences par sequencage 
directement a partir des colonies. 

Une serie de sequences permettant 1' expression et 
25 1- exportation "de phoA ont ete isolees a partir de 1 ' ADN de 
M. Tuberculosis ou de M. Bovis BCG. Parmi ce groupe de 
sequences, deux d-entre elles ont ete d'avantage etudiees, 
les genes entiers correspondant aux inserts ont ete clones' 
sequences, et des anticorps contre le produit de ces genes 
ont servi a montrer en microscopie electronique que ces 
genes codaient pour des antigenes retrouves a la surface 
des bacilles de la tuberculose. L'un de ces genes erp 
codant pour une sequence signal d' exportation consensus, 
1' autre des ne possedait aucune caracteristique de gene 
35 codant pour une proteine exportee, d'apres la sequence. Un 
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autre gene DP428 a ete sequence avant que la sequence du 
genome de M. Tuberculosis ne soit disponible. il contient 
une sequence ressemblant a la sequence consensus 
d'attachement au peptidoglycane, ce qui suggere qu'il 
s'agit aussi d'un antigene vraisemblablement retrouve a la 
suface des bacilles de la tuberculose. L' etude des trois 
genes erp, des, et celui codant pour DP428 montre que le 
systeme phoA que nous avons developpe chez les 
mycobacteries permet de reperer des genes codant pour des 
proteine exportees sans determinant reperable par des 
etudes in silico. Ceci est particulierement vrai pour les 
polypeptides qui ne possedent pas de sequence signal 
consensus (des) ou non pas de similarite avec des proteines 
de fonction connue (erp et DP428) . 



Un certain nombre d' inserts ont ete identifies et 
sequences avant la connaissance du genome de M. 
Tuberculosis, d-autres apres. Ces sequences peuvent etre 
considerees comme des amorces permettant de rechercher des 

20 g§nes codant pour des proteines exportees. A ce jour, une 
serie d' amorces ont ete sequences et les genes entiers 
correspondants ont ete soit sequences, soit identifies 
d' apres la sequence publiee du genome. Pour tenir compte 
des erreurs de sequencage toujours possibles, les regions 

25 en amont ou en aval de certaines amorces ont ete 
considerees comme pouvant faire partie de sequences codant 
pour des proteines exportees. Dans certains cas des 
similarites avec des genes codant pour des proteines 
exportees ou des sequences caracteristiques de signaux 

30 d'exportation ou des caracteristiques topologiques de 
proteines membranaires ont ete detectees. 

Des sequences amorces s'averent corresponds a des 
genes appartenant a des families de genes possedant plus de 
35 50 % de similarite. On peut ainsi indiquer que les autres 
genes detectes par similarite avec une amorce cedent pour 
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des proteines exportees. C'est le cas de la sequence SEQ id 
N» 8G et SEQ ID N° 8H possedant plus de 77 % de similarity 
avec SEQ ID N° 8A' . 

Les sequences pouvant coder pour des proteines 
exportees sont les suivantes : SEQ ID N° 1, 8, 9, 8G 8H 
13, 3, 10, 19, 20, S, 16, 22, 23, 24, 39, 44, 46, et 50. 

Des genes identifies d'apres les amorces a partir de 
la sequence du genome n'ont aucune caracteristique (d'apres 
la sequence) de prot6ines exportees. il s - ag i t des 
sequences suivantes : SEQ ID N° 4, 27, n, 12, 14, 7/ 15 
17, 18, 21, 31, 32, 33, 34, 35, 36, 37, 38,' 40,' 41/42', 43,' 
45, 47, 48, et 49. 



D'apres la sequence d'autres organismes comme E. coli, 
on peut rechercher dans la sequence du genome de M. 
tuberculosis, des genes possedant des similarity avec des 
proteines connues pour etre exportees chez d'autres 
organismes bien que ne possedant pas de sequence signal 
d' exportation. Dans ce cas une fusion avec phoA est un 
protocole avantageux pour determiner si ces sequences de M. 
tuberculosis cedent pour des proteines exportees bien que 
ne presentant pas de sequence signal consensus. II a et€ en 
effet possible de doner SEQ ID N« 49, une sequence 
25 similaire a un gene de E. coli de la famille htrA. Une 
fusion de SEQ ID no 4 9 avec phoA conduit a 1- expression et 
^ 1' exportation de phoA. Des colonies m. smegmatis 
hebergeant une fusion SEQ ID N° 49 phoA sur un plasmide 
pJVED sont bleues. 

30 SEQ ID N° 49 est done consideree comme une proteine 

exportee . 

La methode phoA est done utile pour detecter d'apres 
la sequence de W. Tuberculosis des genes codant pour des 
proteines exportees sans qu'ils ne codent pour des 
35 sequences caracteristiques des proteines exportees. 
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Meme si une sequence possSde des determinants de 
prolines exportSes, cela ne dSmontre pas une exportation 
fonctionnelle. Le systeme phoA permet de montrer que le 
gdne suspect^ code r£ellement pour une protSine export£e. 
Ainsi, il a 6t6 v6rifi£ que la sequence SEQ ID N° 50 
poss^dait bien des signaux d 1 exportation. 



TABLEAU 3 



SEQ ID N° 


Reference de la 
sequence 

correspondante predite 
par Cole et al . 




Annotation 


SEQ ID N°l 


Rv 0203 


* 


Sequence hydrophobe en 
N-terminal 


SEQ ID N°4 
SEQ ID N°27 


Rv 2050 




Pas de prediction 


SEQ ID N°8 
SEQ ID N°9 


Rv 2563 


* 


Prot6ine membranaire 


SEQ ID N° 
8G ' , H * 


Rv 0072 


* 


Possible proteine de 
transport transmembrane ire 
de type ABC 


SEQ ID N Q 11 


Rv 054 6c 


ML 


Protein S-D Lactoyl 
Glutathione-methyl 
glyoxal lyase 


SEQ ID N°12 


jpas de prediction 




non retrouve dans 
M. tuberculosis H37rv 


SEQ ID N*13 
SEQ ID N°3 
SEQ ID N°10 


Rv 1984c 


* 


probable precurseur 
cutinase avec une sequence 
signal N-terminale 


SEQ ID N°14 
SEQ ID N 9 7 


pas de prediction 




pas de prediction 


SEQ ID N°15 


avec decalage de 
lecture, pourrait Stre 
en phase avec Rv 2530c 




pas de prediction 


SEQ ID N°17 


Rv 1303 


ML 


pas de prediction 


SEQ ID N°18 


Rv 0199 


ML 


pas de prediction 


SEQ ID N°19 


Rv 0418 


* 


site de fixation de lipo- 
proteine membranaire 
procaryote, similarite avec 
la N-ac6tyl puromycyne 
acetyl hydrolase 


SEQ ID N°20 
SEQ ID N°6 


Rv 3576 


* 


contient un site de 
fixation de lipoproteine 
membranaire procaryote, 
similarite avec une 
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serine/threonine proteine 
kinase 


SBQ ID N° 21 




ML 


similarity avec une metallo 
peptidase a zinc 


SEQ ID N°31 


non pr£ditc 





{>as de pr6diction 


SEQ ID N Q 32 


Rv 0822c 


ML 


Existence d'une region 
consensus avec la famille 
drac 


SEQ ID N*33 


Rv 1044 




_pas de prediction 


SEQ ID N°34 


non pr^dite 




pas de prediction 


SEQ ID N a 35 


Rv 2169c 




pas de prediction 


SEQ ID N°36 


Rv 3909 


ML 


pas de prediction 


SEQ ID N*37 






similarity avec des 

dihydropricolinate 

synthases 


SEQ ID N°38 


Rv 0175 




pas de prediction 


SEQ ID N°39 


Rv 3006 


ML 


prediction de sequence 
signal de lipoproteine 


SEQ ID N°40 


Rv 0549c 




pas de prediction 


SEQ ID N°41 


Rv 2975c pouvant etre 

wi* puadc avcC l\V ^y/^C 





similarite avec proteine de 
substilis 


SEQ ID N°42 


Rv 2622 




similarite avec une methyl 
transferase 


SEQ ID N°43 


Rv 3278c 


ML 


pas de prediction 


SEQ ID N°4 4 


cvv uju? 


* 


pas de prediction 


SEQ ID N°4 5 


Rv 2169c 


ML 


pas de prediction 


SEQ ID N°46 


Rv 1411c 


* 


probable lipoproteine 
avec une sequence signal 


SEQ ID N°47 


Rv 1714 




similarite avec une 
gluconate 3-dehvdrogenase 


OEi\l 1U N HO 


Rv 0331 




similarite avec une sulfide 
dehydrogenase et une 
sulfide quinone reductase 


SEQ ID N°4 9 


Rv 0983 


ML 


Similarite avec une serine 
protease HtrA 
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SEQ ID N°5 








SEQ ID N°16 


Rv 3010 


ML, 


Proteine de surface 
Dcrlhelct ct al. 1995 


SEQ ID N°22 
SEQ ID N°23 
SEQ ID N°24 


Rv 3763 


A 


Contient un siLe do 
fixation de lipoproteins 
rnembranaire eucaryote 


SEQ ID N°50 


Rv 0125 


* 


Site actif des serines" 
proteases 

Sequence signal N-terminale 
possible 



LSgende du tableau 3 : 

Correspondance des sequences selon 1" invention avec les 
sequences predites par Cole et al . 1998, Nature, 393, 537- 
5 544 . 



* : Prediction que la proteine codee par la sequence 

soit exportee 
ML : Prediction de similarity avec M. leprae. 



15 



10 Exemple 6 : 

Caracteristiques et obtention de la proteine M1C25 

L'extremite N terminale de la proteine M1C25 a ete 
detectee par le systeme PhoA comme permettant 1 ' exportation 
de la proteine de fusion, necessaire a 1- obtention de son 
activite phosphatase. 

La sequence d'ADN codant pour l'extremite N terminale de 
la proteine M1C25 est contenue dans la sequence SEQ ID N« 
20 de la presente demande de brevet. 

A partir de cette sequence amorce, le gene complet 
codant pour la proteine M1C25 a ete recherche dans l e 
genome de w. tuberculosis (Fondation Welcome Trust, site 
Sanger) . 

Le centre Sanger a attribue a M1C25 les noms: 



20 
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Rv3576, 
MTCY06G11.23, 
pknM 

Sequence SEP ID N e 29 du a6ne cnmplet M1C25 (714 haa**) ■ 
cf. Figure 29 

Ce gene code pour une proteine de 237 AA, de 2S kDa de 
masse molaire. Cette proteine est referencee dans les 
banques sous les appellations: 
PID:e306716, 
SPTREMBL:P96858 

Sequence SEP TP N° 30 d* 1» proton* mt C 25 
15 amines) ; cf . Figure 30 

M1C25 contient un site de fixation a la partie 
lipidique des lipoprotSines de membrane des procaryotes 
(PS00013 Prokaryotic membrane lipoprotein lipid attachment 
20 site: 

CTGGTCGGTG CGTGCATGCT CGCAGCCGGA TGC) . 

La fonction de M1C25 n'est pas certaine mais elle 
possede tres probablement une activite "s6rine/threonine- 
proteine kinase". Des resaemblances sont a noter avec la 
25 moitie C terminale de K08G_MYCTU Q11053 Rvl266c 
(MTCY50.16). Des similarity sont aussi retrouvees avec 
KY28_MYCTU. 

En 5- du gene codant pour M1C25 se trouve un gene 
codant potentiellement pour une proteine regulatrice 
(PID:e306715, SPTREMBL: P96857 , Rv3575c, (MTCY06G11 . 22c) ) 

Le profil d' hydrophobics (Kyte et Doolitle) de M1C25 
est represents a la figure 56. 

Un site de clivage de la sequence signal est predit 
(SignalP Vl.l; World Wide Web Prediction Server, Center for 
Biological Sequence Analysis) entre les acides amines 31 et 
32: AVA-AD. Ce site de coupure est derriere un motif "AXA" 
classique. Cette prediction est compatible avec le profil 



30 



35 
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d'hydrophobicite. Dans cette sequence signal potent ielle il 
est a remarqud la r6p6tition trois fois de la sequence des 
trois acides amines LAA. 

5 Clonage du g£ne M1C25 en vue de la production de la 
protSine qu'il code: 

Un couple d'amorces a 6t6 synthStisS afin d'amplifier, 

a partir de l'ADN ginomique de M. tuberculosis, souche 

10 H37Rv, la totality de la sequence codant pour le 

polypeptide M1C25. L'amplicon obtenu a <§te clone dans un 
vecteur d' expression. 



15 



20 



25 



30 



Des couples d« amorces appropriSs pour 1 ' amplification 
et le clonage de la sequence codant pour M1C25 ont 6te 
synth§tis6s : 
-amorce aller : 

51 " AT AATACCATGGGC AAGCAGC T AGCCGCGC - 3' 
-amorce retour : 

5 , - ATTTATAGATC TSTGCTXfi^£AA£CTTGGgCGgS - 3' 



La partie soulignee repr<§sente les sequences hybridant 
specif iquement avec la sequence M1C25 et les extremites 5' 
correspondent a des sites de restriction en vue du clonage 
de l'amplicon r6sultant dans un vecteur de clonage et/ou 
d' expression. 

Un vecteur particulier utilise pour !■ expression du 
polypeptide M1C25 est le vecteur pQE60 commercialism par la 
sociStS Qiagen, en suivant le protocole et les 
recommandations proposes par cette marque. 

Les cellules utilisees pour le clonage sont des 
bactSries : £, coli XLl-Blue (rSsistante a la 
tetracycline) . 

Les cellules utilises pour 1- expression sont des 
35 bactSries : E. coli M15 (rSsistante a la kanamycine) 
contenant le plasmide pRep4 (M15 pRep4) . 
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La production de la proline MC25 est illustree par les 
figures 57 A et B. ( Extraits bact£riens de la souche E. 
coli M15 contenant le plasmide pMlC25. Les cultures 
bact6riennes et les extraits sont pr<§par£s selon Sambrook 
et al. (1989), L'analyse des extraits bacr6riens est 
effectu£e selon les instructions de Quiagen (1997) . 
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REVENDICATIONH 

1. Vecteur recombinant de criblage, de clonage et/ou 
d' expression, caracterise en ce qu'il se replique chez des 
5 mycobacteries et en ce qu'il contient : 

1) un replicon fonctionnel chez les mycobacteries ; 

2) un marqueur de selection ; 

3) une cassette rapporteur comprenant : 

a) un site de clonage multiple <polylinker) , 
10 b) eventuellement un terminateur de transcription actif 
chez les mycobacteries, en amont du polylinker, 

c) une sequence nucleotidique codante issue d'un gene 
codant pour un marqueur d' expression, d' exportation et/ou 
de secretion de proteine, ladite sequence nucleotidique 
etant depourvue de son codon d' initiation et de ses 
sequences de regulation, et 

d) une sequence nucleotidique codante issue d'un gene 
codant pour un marqueur d'activite de promoteurs contenus 
dans le meme fragment, ladite sequence nucleotidique etant 
pourvue de son codon d 1 initiation . 
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2. Vecteur recombinant selon la revendication l, 
caracterise en ce que la sequence nucleotidique codante 
issue d'un gene codant pour un marqueur d' expression 
d'exportation et/ou de secretion de proteine est une 
sequence codante issue du gene phoA de la phosphatase 
alcaline . 



3. Vecteur recombinant selon 1'une des revendications 1 et 
2, caracterise en ce que la sequence nucleotidique codante 
issue d'un gene codant pour un marqueur d' expression 
d'exportation et/ou de secretion de proteine est une 
sequence codante du gene de la P-agarase. de la nuclease 
d'un staphylocoque ou de la P-lactamase d'une mycobacteria 
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4. Vecteur recombinant selon l'une des revendications 1 a 
3, caracterise en ce que la sequence nucleotidique codante 
issue d'un gSne codant pour un marqueur d'activite de 
promoteurs contenus dans le meme fragment est une sequence 
codante issue du gene luc de la lucif erase de luciole. 



10 



S. Vecteur recombinant selon l'une des revendications 1 a 
4, caracterise en ce que la sequence nucleotidique codante 
issue d'un gene codant pour un marqueur d'activite de 
promoteurs contenus dans le meme fragment est une sequence 
codante issue du gene GFP de la Green Fluorescent Protein. 



6. Vecteur recombinant selon l'une des revendications 1 a 

5, caracterise en ce que le terminateur de transcription 
IS actif chez les mycobacteries est le terminateur du 

coliphage T4 (tT4> . 

7. Vecteur recombinant selon l'une des revendications 1 a 

6, caracterisg en ce qu'il est un plasmide choisi parmi les 
20 plasmides suivants deposes a la CNCM (Collection Nationale 

de Cultures de Microorganismes, Paris, France) : 

a) pJVEDa depose a la CNCM sous le N° 1-1797, 
le 12/12/1996, 

b) pJVEDb depose a la CNCM sous le N° 1-1906, le 25 juillet 
25 1 9 9 7, 

c) pJVEDc depose a la CNCM sous le N° 1-1799 i e 
12/12/1996. 



30 



8. Vecteur recombinant selon l'une des revendications 1 a 
7, caracterise en ce qu'il comprend en l'un des sites de 
clonage du polylinker une sequence d'acide nucleique de 
mycobacterie chez laquelle on detecte un polypeptide 
susceptible d'etre exporte et/ou secrete, et/ou d'etre 
induit ou reprime lors de 1' infection par ladite 
35 mycobacterie ou encore exprime ou produit de facon 
constitutive, ainsi que les sequences promotrices et/ou 
rSgulatrices associees susceptibles de permettre ou de 
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favoriser 1 ' exportation et/ou la secretion dudit 
polypeptide, ou tout ou partie de gene codant pour ledit 
polypeptide . 

5 9. Vecteur recombinant selon I'une des revendications l h 

8, caract6ris6 en ce que la sequence d'acide nucieique de 
mycobacterie qu'il contient est obtenue par fragmentation 
physique ou par digestion enzymatique de 1 1 ADN gSnomique ou 
de 1' ADN complement aire d'un ARN d'une mycobacterie. 

10 

10. Vecteur recombinant selon l'une des revendications 1 a 

9, caracterisS en ce que ladite mycobacterie est M. 
tuberculosis . 



15 li. Vecteur recombinant selon l'une des revendications 1 a 
9, caracterise en ce que ladite mycobacterie est choisie 
parmi W. africanum, M. bovis, M. avium ou M. leprae. 

12. Vecteur recombinant selon la revendication 10, 
20 caracterise en ce qu'il est un plasmide choisi parmi les 
plasmides suivants deposes a la CNCM : 

a) P 6D7 depose le 28 janvier 1997 a la CNCM sous le N°I~ 
1814, 

b) P 5A3 depose le 28 janvier 1997 a la CNCM sous le N°I- 
25 1815, 

c) pSF6 depose le 28 janvier 1997 a la CNCM sous le N°I- 
1816, 

d) P 2A29 depose le 28 janvier 1997 & la CNCM sous le N°I- 
1817, 

30 e) pDP428 depose le 28 janvier 1997 a la CNCM sous le N*I- 
1818, 

f) p5B5 depose le 28 janvier 1997 a la CNCM sous le N*I- 
1819, 

9) P1C7 depose le 28 janvier 1997 k la CNCM sous le N°I- 
35 1820, 

h) P 2D7 depose le 28 janvier 1997 k la CNCM sous le N°I- 
1821, 
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i) plB7 depose le 31 janvier 1997 a la CNCM sous le N«I- 
1843, 

j) pJVED/M. tuberculosis deposS le 25 juillet 1997 a la 
CNCM sous le N° 1-1907, 
5 k) pMlC25 depose le 4 aoQt 1998 a la CNCM sous le n°I-2062. 

13. Vecteur recombinant selon la revendication 12, 
caracterise en ce qu'il s'agit du plasraide pDP428 depos6 le 
28 janvier 1997 a la CNCM sous le N°I-1818. 

10 

14. Procede de criblage de sequences de nucl6otides issues 
de mycobacteries pour determiner la presence de sequences 
correspondant a des polypeptides exportes et/ou secretes 
pouvant etre induits ou reprimes lors de 1' infection, leurs 

15 sequences promotrices et/ou regulatrices associees 
susceptibles notamment de permettre ou de favoriser 
1' exportation et/ou la secretion desdits polypeptides 
d'interet, ou tout ou partie de genes d'interet codant pour 
lesdits polypeptides, caracterisS en ce qu'il met en oeuvre 

20 un vecteur selon l'une des revendications 1 I 13 . 

15. Procede de criblage selon la revendication 14, 
caracterise en ce qu'il comprend les etapes suivantes : 

a) la fragmentation physique des sequences d'ADN de 
25 mycobacteries ou leur digestion par au raoins une enzyme 

determinee et' la recuperation des fragments obtenus ; 

b) 1- insertion des fragments obtenus a l'etape a) dans un 
site de clonage, compatible le cas echeant avec 1' enzyme de 
l'etape a), du polylinker d'un vecteur selon l'une des 

30 revendications 1 a 13 ,• 

c) si besoin, 1' amplification desdits fragments contenus 
dans le vecteur, par exemple par replication de ce dernier 
apres insertion du vecteur ainsi modifie dans une cellule 
determinee, de preference B coli ; 

35 d) la transformation de cellules hStes par le vecteur 
amplifie a l'etape c) , ou en 1» absence d' amplification, par 
le vecteur de l'etape b) ; 
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e) la culture de cellules hdtes transformees dans un milieu 
permettant la mise en evidence du marqueur d' exportation 
et/ou de secretion, et /ou du marqueur d'activite de 
promoteurs contenu dans le vecteur ; 

f) la detection des cellules notes positives (colonies 
positives) pour 1' expression du marqueur d' exportation 
et/ou de secretion, et /ou du marqueur d'activite de 
promoteurs ; 

g) l'isolement de l'ADN des colonies positives et 
1- insertion de cet ADN dans une cellule identique a celle 
de l'etape c) ; 

h) la selection des insertions contenues dans le vecteur, 
permettant l'obtention de clones positifs pour le marqueur 
d' exportation et/ou de secretion, et /ou pour le marqueur 
d'activite de promoteurs ; 

i) l'isolement et la caracterisation des fragments d 'ADN de 
mycobacteries contenues dans ces inserats, et l'etape i) du 
precede pouvant comporter en outre une etape de sequencage 
des insertions selectionnees . 

16. Banque d 1 ADN genomique ou d'ADNc complementaire d'ARNm 
de mycobacterie, caracterisee en ce qu'elle est obtenue par 
un procede selon la revendication 14 et/ou un precede 
comprenant les etapes a) et b) , ou a) , b) et c) du procede 
selon la revendication 15. 

17. Banque d'ADN genomique ou d'ADNc complementaire d'ARNm 
de mycobacterie selon la revendication 16, caracterisee en 
ce que ladite mycobacterie est une mycobacterie pathogene. 

18. Banque d'ADN genomique ou d'ADNc complementaire d'ARNm 
de mycobacterie selon la revendication 17, caracterisee en 
ce que ladite mycobacterie est une mycobacterie appartenant 
au groupe du complexe Mycobacterium tuberculosis. 
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19. Banque d'ADN genomique ou d'ADNc complementaire d'ARNm 
de mycobacterie selon la revendication 18, caracterisee en 
ce que ladite mycobacterie est Mycobacterium tuberculosis. 

20. Sequence nucleotidique de mycobacterie ou coraprenant 
une sequence nucleotidique de mycobactdrie susceptible 
d'Stre select ionnee par un procede selon l'une des 
revendications 14 et 15. 

10 21. Sequence nucleotidique de mycobacterie ou comprenant 
une s6quence nucleotidique de mycobacterie selon la 
revendication 20, caracterisee en ce que ladite 
mycobacterie est choisie parmi M. tuberculosis, M. bovis, 
M. africanum, M. avium, M. leprae, M. paratuberculosis, M. 

15 kansassi ou M. xenopi . 

22. Sequence nucldotidique selon l'une des revendications 
20-21 caracterisee en ce qu'elle est choisie parmi les 
sequences de fragments d'ADN de mycobacterie de sequence 
nucleique SEQ ID N°l a SEQ ID N° 24C, SEQ ID N-27A a SEQ ID 
N°27C, SEQ ID N°29 et SEQ ID N° 31A a SEQ ID N«50F. 

23. Sequence nucleotidique de mycobacterie l'une des 
revendications 20-21 caracterisee en ce qu'elle est choisie 
parmi les sequences de fragments d'ADN de mycobacterie de 
sequence SEQ ID N°l, SEQ ID N°3A, SEQ ID N«5A, SEQ ID N°6A 
SEQ ID N»7A, SEQ ID N°8A, SEQ ID N°9A, SEQ ID N°10A, SEQ ID 
N°27A ou SEQ ID N°29 contenus respectivement dans les 
vecteurs pDP428 (CNCM, N°I-1818) , p6D7 (CNCM, N°I-1814) 
P5P6 (CNCM, N«I-1816), P 2A29 (CNCM, N<>I-1817) , p5 B5 (CNCm' 
N°I-1819),plC7 (CNCM, N*I-1820) , p2D7 <CNCM,N°I-1 82 1) ' 
P1B7(CNCM, N°I-1843), p 5A 3 (CNCM, N oi-1815) et P M1C25 
(CNCM, N"I-2062) . 



20 
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30 



35 24. Sequence nucleotidique comprenant la totalite du cadre 
ouvert de lecture d'une sequence selon l'une quelconque des 
revendications 20 a 23. 
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25. Polynucleotide caracterise en ce gu'il comprend un 
polynucleotide choisi parmi ; 

a) un polynucleotide dont la sequence est compiementaire de 
la sequence d'un polynucleotide selon 1'une des 
revendications 20 a 24, 

b) un polynucleotide dont la sequence comporte au moins 50% 
d'identite avec un polynucleotide selon l'une des 
revendications 20 a 24, 

c) un polynucleotide hybridant dans des conditions de forte 
stringence avec une sequence de polynucleotide selon l'une 
des revendications 20 a 24, 

d) un fragment d'au moins 8 nucleotides consecutifs d'un 
polynucleotide defini selon l'une des revendications 20 a 

15 24 ou defini en a) . 

26. Polypeptide, leurs fragments ou fragments 
biologiquement actifs ou leurs polypeptides homologues, 
susceptible d'etre code par une sequence nucleotidique de 
mycobacterie selon l'une des revendications 20 £ 25, et 
susceptible d'etre exporte et/ou secrete, et/ou induit ou 
reprime, ou exprime de facon constitutive lors de 
1 ' infection. 

25 27. Mycobacterie recombinante caracterisee en ce qu'elle 
est transforniee par un vecteur recombinant selon l'une des 
revendications 1 I 13. 



20 



30 



35 



28. Polynucleotide dont la sequence est choisie parmi les 
sequences nucieotidiques de sequence SEQ ID N°l a SEQ ID 



N°2. 



29. Polynucleotide caracterise en ce qu'il comprend un 
polynucleotide choisi parmi : 

a) un polynucleotide dont la sequence est choisie parmi les 
sequences nucieotidiques SEQ ID N°l d SEQ ID N°2, 
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b) un polynucleotide dont la sequence nucleique est la 
sequence comprise entre le nucleotide en position nt 964 et 
le nucleotide en position nt 1234, extremites indues, de 
la sequence SEQ ID N°l, 

O un polynucleotide dont la sequence est complementaire de 
la sequence d'un polynucleotide defini en a) ou b) , 

d) un polynucleotide dont la sequence comporte au moins 50% 
d'identite avec un polynucleotide defini en a), b) ou c) , 

e) un polynucleotide hybridant dans des conditions de forte 
stringence avec une sequence de polynucleotide defini en 
a) , b) ,c) ou d) , 

f) un fragment d'au moins 8 nucleotides consecutifs d'un 
polynucleotide defini en a), b) , c) , d)ou e) . 

15 30. Polynucleotide selon 1-une des revendications 20 a 25, 
28 et 29, caracterise en ce que sa sequence nucleique 
hybride avec 1 1 ADN de sequence de mycobacteries et 
pref6rentiellement avec de 1 1 ADN de sequences de 
mycobact6ries appartenant au complexe de Mycobacterium 

20 tuberculosis. 

31. Polypeptide caracterise en ce qu'il est code par une 
sequence polynucieotidique selon 1-une des revendications 
20 a 25. 



25 



30 



32. Polypeptide caracterise en ce qu'il comprend un 
polypeptide choisi parmi : 

a) un polypeptide dont la sequence d'acides amines est 
comprise dans une sequence d'acides amines choisie parmi 
les sequences d'acides amines SEQ ID N' l a SEQ ID N° 24C 
SEQ ID N° 27A a SEQ ID N° 28 et SEQ ID N° 30 a SEQ ID N° 
50F, W " 

b) un polypeptide homologue au polypeptide defini en a) 

O un fragment d'au moins 5 acides amines d'un polypeptide 
35 defini en a) ou b) , 

d) un fragment biologiquement actif d'un polypeptide defini 
en a) , b) , ou c) . 



WO 99/09186 




7FR98/01813 



33. Polypeptide dont la sequence d'acides amines est 
comprise dans la sequence d'acides amines SEQ ID N'l ou SEQ 
ID N«2, ou polypeptide de sequence d'acides amines SEQ ID 

vr ft r% 



N°28 



34. Polynucleotide caracterise en ce qu'il code pour 
polypeptide selon l'un des revendications 32 et 33. 



un 



35. Sequence d'acide nucleique utilisable comme amorce, 
caracterisee en ce que ladite sequence est choisie parmi 
les sequences d'acide nucleique de polynucleotide selon 
l'une des revendications 20 S 25, 28 a 30, et 34. 

36. Sequence d'acide nuclSique selon la revendication 35, 
caracterisee en ce que ladite sequence est choisie parmi 
les sequences SEQ ID N°25 et SEQ ID N°26. 

37. Sequence d'acide nucleique selon l'une des 
revendications 35 et 36 pour la detection et/ou 
1' amplification de sequences nucleiques. 

38. Sequence d'acide nucleique utilisable comme sonde, 
caracterisee en ce que ladite sequence est choisie parmi 
les sequences d'acide nucleique selon l'une des 
revendications 20 $l 25, 28 a 30, et 34. 

39. Sequence d'acide nucleique selon la revendication 38 
caracterisee en ce qu'elle est marquee par un compose 
radioactif ou par un compose" non radioactif . 

40. Sequence d'acide nucleique selon 1-une des 
revendications 38 et 39, caracterisee en ce que celle-ci 
est immobilisee sur un support, de maniere covalente ou 
non-covalente. 
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41. Sequence d'acide nucleique selon l'une des 
revendications 38 a 40 pour la detection et/ou 
1 1 amplification de sequences nucl^iques. 

42. Sequence d'acide nucleique selon l'une des 
revendications 38 a 41, caracterisee en ce que ladite 
sequence est une sequence comprise entre le nucleotide en 
position nt 964 et le nucleotide en position nt 1234, 
extremitgs indues, de la sequence SEQ ID N°i. 

43. Vecteur recombinant de clonage, d'expression et/ou 
d' insertion , caracterise en ce qu'il contient une sequence 
d'acide nucleique de polynucleotide selon l'une des 
revendications 20 & 25, 28 a 30, et 34. 

44. Cellule hSte, caracterisee en ce qu'elle est 
transforms par un vecteur recombinant selon la 
revendication 43 . 

20 45. Cellule h6te selon la revendication 44, caracterisee en 
ce qu'il s'agit de la souche de E. coli transformee par le 
plasmide pDP428 depose le 28 janvier 1997 a la CNCM sous le 
N»I-1818 ou transformee par le plasmide P M1C25 depose le 
4 aoGt 1998 a la CNCM sous le n°I-2062, ou d'une souche de 

25 M. tuberculosis, M. bovis ou m. africanum possedant 
potentiellement tous les systemes de regulation appropries. 

Procede de preparation d'un polypeptide, caracterise en 
ce qu'il met en oeuvre un vecteur selon la revendication 

A "J 



46. 
ce 

30 43 



47. Polypeptide recombinant susceptible d'etre obtenu par 
un procSdS selon la revendication 46. 

35 48. Polypeptide hybride, caracterise en ce qu'il comporte 
au moins la sequence d'un polypeptide selon l'une des 
revendicatibhs 26, 32, 33 et 47 et une sequence d'un 
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polypeptide susceptible d'induire une reponse immunitaire 
chez 1 ' homme ou 1 ' animal . 

49. Polypeptide hybride selon la revendication 48, 
5 caracterise en ce que le polypeptide susceptible d'induire 
une reponse immunitaire contient au moins un determinant 
antigenique capable d'induire une reponse humorale et/ou 
cellulaire. 

10 50. Polynucleotide codant pour un polypeptide hybride selon 
l'une des revendications 48 et 49. 

51. Polypeptide hybride selon l'une des revendications 48 
et 49, caracterisee en ce qu'il s'agit d'une proteine 
recombinante obtenue par 1' expression d'un polynucleotide 
selon la revendication 50 . 

52. Procede pour la detection in vitro d'anticorps diriges 
centre une mycobacterie et preferentiellement une bacterie 
du complexe Mycobacterium tuberculosis dans un echantillon 

biologique, caracterise en ce qu'il comprend les etapes 
suivantes : 

a) mise en contact de 1 'echantillon biologique avec un 
polypeptide selon l'une des revendications 26, 32 33 et 

25 47 ; 

b) mise en evidence du complexe antigene-anticorps forme. 

53. Procede pour la detection d'une infection par une 
mycobact€rie et preferentiellement une bacterie du complexe 
Mycobacterium tuberculosis dans un mammifere, caracterise 
en ce qu'il comprend les etapes suivantes : 
a) preparation d'un echantillon biologique contenant des 
cellules dudit mammifere plus particulierement des cellules 
du systeme immunitaire dudit mammifere et plus 
particulierement encore des cellules T ; 
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b) incubation de 1 ■ echantillon biologigue de l'etape a) avec 
un polypeptide selon l'une quelconque des revendications 
26, 32, 33 et 47 ; 

c) detection d'une reaction cellulaire indiquant une 
5 sensibilisation pr§alable du mammifere audit polypeptide 

notamment la proliferation cellulaire et/ou la synthese de 
proteines telles que 1' interferon gamma; 

d) detection d'une reaction d' hypersensibilite retards ou 
de sensibilisation du mammifere audit polypeptide. 

10 

54. Kit pour le diagnostic in vitro d'une infection par une 
mycobacterie appartenant au complexe Mycobacterium 
tuberculosis, comprenant : 

a) un polypeptide selon l'une des revendications 26, 32 , 33 
15 et 47 ; 

b) le cas ichSant, les reactifs pour la constitution du 
milieu propice k la reaction immunologique; 

Oles reactifs permettant la detection des complexes 
antigdne-anticorps produits par la reaction immunologique ; 
20 d) le cas echeant, un echantillon biologique de reference 
(temoin negatif) depourvu d» anticorps reconnus par ledit 
polypeptide ; 

e) le cas echeant, un echantillon biologique de reference 
(temoin positif) contenant une quantity predetermine 

25 d'anticorps reconnus par ledit polypeptide. 

55. Anticorps mono- ou polyclonaux, leurs fragments, ou 
anticorps chim£riques, caractSrises en ce qu'ils sont 
capables de reconnaitre specif iquement un polypeptide selon 

30 l'une des revendications 26, 32, 33 et 4 7 

56. Anticorps selon la revendication 55, caracterise en ce 
qu'il s'agit d'un anticorps marque. 

35 57. ProcSdS pour la detection specif ique de la presence 
d'un antigene d'une bacterie du complexe Mycobacterium 
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tuberculosis dans un echantillon biologique, caracterise en 
ce qu'il comprend les Stapes suivantes : 

a) mise en contact de 1 'echantillon biologique avec un 
anticorps selon l'une des revendications 55 et 56 ; 
5 b) mise en evidence du complexe antigene- anticorps forme. 

58. Kit pour la detection specif ique de la presence d'un 
antigene d'une bacterie du complexe Mycobacterium 
tuberculosis dans un echantillon biologique, caracterisS en 
ce qu'il comprend les Elements suivants : 

a) un anticorps polyclonal ou monoclonal selon l'une des 
revendications 55 et 56 ; 

b) les reactifs pour la constitution du milieu propice a la 
reaction immunologique ; 

15 c) les reactifs perraettant la detection des complexes 
antigene-anticorps produits par la reaction immunologique. 

59. ProcSde de detection et d' identification rapide d'une 
mycobacterie et preferentiellement de M. tuberculosis dans 

20 un echantillon biologique, caracterise en ce qu'il 
comporte les Stapes suivantes : 

a) isolement de l'ADN a partir de 1 ' echantillon biologique 
a analyser, ou obtention d'un ADNc a partir de 1 ' ARN de 
1' echantillon biologique ; 
25 b) amplification specif ique de l'ADN des mycobacteries 
appartenant au complexe Mycobacterium tuberculosis a 
1'aide d' amorces selon l'une des revendications 35 a 37 ; 

c) analyse des produits d' amplification. 

30 60. Procede pour la detection de bacteries appartenant au 
complexe Mycobacterium tuberculosis dans un echantillon 
biologique, caracterise en ce qu'il comprend les Stapes 
suivantes : 

a) mise en contact d'une sonde oligonucleotidique selon 
35 l'une des revendications 38 a 42 avec un echantillon 
biologique, l'ADN contenu dans 1 • echantillon biologique 
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ayant, le cas Scheant, prealablement Ste rendu accessible a 
1' hybridation, dans des conditions permettant 1 ' hybridation 
de la sonde a l'ADN d'une bacterie du complexe 
Mycobacterium tuberculosis ; 

b) detection de l'hybride forme entre la sonde 
oligonucleotidique et l'ADN de 1 ' echantillon biologique. 

61. Procede pour la d6tection de bacteries appartenant au 
complexe Mycobacterium tuberculosis dans un echantillon 

biologique, caracterise en ce qu'il comprend les etapes 
suivantes : 

a) mise en contact d'une sonde oligonucleotidique 
immobilisSe sur un support selon la revendication 4 0 avec 
un echantillon biologique, l'ADN de 1 ' echantillon, ayant, 

15 le cas echeant, ete prealablement rendu accessible a 
1' hybridation, dans des conditions permettant 
1 ' hybridation de la sonde a l'ADN d'une bacterie du 
complexe Mycobacterium tuberculosis ; 

b) mise en contact de l'hybride forme entre la sonde 
oligonucleotidique immobilisee sur un support et l'ADN 
contenu dans 1 ' Echantillon biologique, le cas echeant 
apres elimination de l'ADN de 1 « echantillon biologique 
n' ayant pas hybride avec la sonde, avec une sonde 
oligonucleotidique marquee selon la revendication 39. 

25 

62. Procede de detection selon la revendication 61, 
caracterise en ce que, prealablement a l'etape a), l'ADN de 
1' echantillon biologique, ou l'ADNc obtenu par 
transcription inverse de l'ARN de 1 'echantillon, est 

30 amplifie a l'aide d'un couple d' amorces selon l'une des 
revendi cat ions 3S a 37. 

63. Procede pour la detection de la presence d'une bacterie 
appartenant au complexe de Mycobacterium tuberculosis dans 

35 un echantillon biologique, caracterise en ce qu'il comprend 
les etapes suivantes : 



20 
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a) mise en contact de 1 1 Echantillon biologique avec un 
couple d f amorces selon l'une des revendications 35 a 37, 
1 ' ADN contenu dans 1 • Echantillon ayant etE, le cas EchEant, 
prEalablement rendu accessible a 1 ' hybridation, dans des 
conditions permettant une hybridation des amorces d l'ADN 
d'une bactErie du complexe Mycobacterium tuberculosis ; 

b) amplification de l'ADN de la bactErie du complexe 
Mycobacterium tuberculosis ; 

c) mise en Evidence de 1 1 amplification de fragments d 1 ADN 
correspondant au fragment encadrE par les amorces, par 
exemple par Electrophorese sur gel ou au moyen d'une sonde 
oligonuclEotidique marquee selon la revendication 39. 

64. ProcEdE pour la detection de la presence d'une bacterie 
appartenant au complexe de Mycobacterium tuberculosis dans 

un echantillon biologique, caracterisE en ce qu'il comprend 
les etapes suivantes : 

a) mise en contact de 1 • Echantillon biologique avec deux 
couples d' amorces selon I'une des revendications 35 a 37, 
l'ADN contenu dans 1 » Echantillon ayant EtE, le cas 
EchEant, prEalablement rendu accessible & 1 ■ hybridation, 
dans des conditions permettant une hybridation des amorces 
a 1 ' ADN d'une bactErie du complexe Mycobacterium 
tuberculosis ; 

b) amplification de 1 1 ADN de la bactErie du complexe 
Mycobacterium tuberculosis ; 

c) mise en Evidence de 1 ' amplification de fragments d 1 ADN 
correspondant au fragment encadre par lesdites amorces, par 
exemple par ElectrophorSse sur gel ou au moyen d'une sonde 
oligonuclEotidique marquEe selon la revendication 39. 

65. Kit pour la detection de la presence d'une bactErie du 
complexe Mycobacterium tuberculosis dans un echantillon 

biologique, caractErisE en ce qu'il comprend les Elements 
suivants : 



WO 99/09186 



7FR98/01813 



120 



a) une sonde oligonuclSotidique selon l'une des 
revendications 38 a 42 ; 

b) les r^actifs nScessaires a la mise en oeuvre d'une 
reaction d 1 hybridation ; 

5 c) le cas 6ch6ant, un couple d' amorces selon l'une des 
revendications 35 £ 37 ainsi que les r6actifs n6cessaires 
a une reaction d 1 amplification de l'ADN (ADN g£nomique, 
plasmidique ou ADNc) d'une bactSrie du complexe 
Mycobacterium tuberculosis. 

10 

66, Kit ou necessaire pour la detection de la presence 
d'une bact£rie du complexe Mycobacterium tuberculosis dans 
un Schantillon biologique, caract6ris§ en ce qu'il comprend 
les elements suivants : 
15 a) une sonde oligonucl£otidique, dite sonde de capture, 
selon la revendication 4 0 ; 

b) une sonde oligonucl^otidique, dite sonde de relation, 
selon l'une des revendications 38 a 42 ; 

c) le cas ech§ant, un couple d' amorces selon l'une des 
20 revendications 35 a 37 ainsi que les reactifs nScessaires 

a une reaction d' amplification de 1 1 ADN d'une bact^rie du 
complexe Mycobacterium tuberculosis. 



67. Kit pour 1« amplification de l'ADN d'une bact^rie du 
25 complexe Mycobacterium tuberculosis present dans un 
Schantillon biologique, caract§ris§ en ce qu'il comprend 
les Elements suivants : 

a) un couple d'amorces selon l'une des revendications 35 a 
37 / 

30 b) les rSactifs nScessaires pour effectuer une reaction 
d' amplification d' ADN ; 

c) Sventuellement un composant permettant de v§rifier la 
sequence du fragment amplififi, plus particulierement une 
sonde oligonuclSotidique selon l'une des revendications 38 
35 a 42. 
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68. Composition immunogene caract€risee en ce qu'elle 
comprend un ou plusieurs polypeptides selon I 1 une des 
revendications 26, 32, 33 et 47 et/ou un ou plusieurs 
polypeptides hybrides selon I'une des revendications 48, 49 

5 et 51. 

69. Vaccin caract6ris6 en ce qu'il contient un ou plusieurs 
polypeptides selon l'une des revendications 26, 32, 33 et 
47 et/ou un ou plusieurs polypeptides hybrides selon l'une 

10 des revendications 48, 49 et 51, en association avec un 
vShicule pharmaceutiquement compatible et, le cas 6ch6ant 
un ou plusieurs adjuvants de l'immunite appropri6s. 

70. Vaccin destine 3 1 r immunisation a l'encontre d'une 
15 infection bactSrienne ou virale, telle que la tuberculose 

ou l'hepatite, comprenant un vecteur selon la revendication 
43 ou un polynucleotide selon la revendication 50, en 
association avec un vehicule pharmaceutiquement acceptable. 

20 71. Vaccin caractSrise en ce qu'il contient une ou 
plusieurs sequences nucleotidiques selon l'une des 
revendications 20 a 24 et/ou un ou plusieurs 
polynucleotides selon la revendication 25 en association 
avec un vehicule pharmaceutiquement compatible et, le cas 

25 6ch§ant, un ou plusieurs adjuvants de I 1 immunity 
appropri€s . 

72. MSthode de criblage de molecules capables d'inhiber 
la croissance de mycobactSries ou le maintien de 
30 mycobact§ries dans un h6te, caractSrisee en ce que lesdites 
molecules bloquent la synthase ou la fonction des 
polypeptides codes par une sequence nuclSotidique selon 
l'une quelconque des revendications 20 & 24 ou par un 
polynucleotide selon la revendication 25. 

35 



10 
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73. Methode de criblage selon la revendication 72, 
caracterisee en ce que les molecules sont des anti- 
messagers ou induisent la synthese d ' anti-messagers . 

74. Molecules capables d'inhiber la croissance de 
mycobacteries ou le maintien de mycobacteries dans un note, 
caracterisees en ce que lesdites molecules sont 
synthetisees d'apres la structure des polypeptides codes 
par une sequence nucleotidique selon l'une quelconque des 
revendications 20 a 24 ou par un polynucleotide selon 

la revendication 25. 
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I GGATCCCAGGGAACGTGACC ATG GTC GTA GGG ATG ACT TGA CAGTTTCAACGGGGTGCGACCACCGTTGCGC 72 
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CGC GTT GCG GGC GTC CAG CCG CAG 
RVAGVQPQ 


CGA 
R 


CAC 
H 


CAC 
H 


ATA 
I 


CGG 
R 


CCG GTC 
P V 


CGG 
R 


385 
88 


TTG 
L 


CGG 
R 


GGG 
G 


CCG 
P 


TTG GGT GGG GTT GGG TGC CTC CGT 
LGGVGCLR 


CAC 
H 


CCC 
P 


AGG 
R 


CAG 
Q 


TTC 

F 


GCT GGC 
A G 


TAT 
Y 


445 
108 


TTG 
L 


TCG 
S 


CAG 
Q 


TAG 
* 


CGC GACGGC ATTGTCG ATG TCT TGG TAG CTAGCATCCGGTCGGGGGGCCGCTACCAGCG 
M S W * - 



27 



47 



67 



87 



107 



4 



516 CCAGCGCCGGGGCTCCCCGGTCCGGGTAGTGCGCGTCGAGTTGGTCGTGGACCAGCA ATG ACT GCG ACC CGG 587 

M T A T R 5 

588 CGA CTT CGA AAC CGC CAC CGG TTA GAT TCC CCG ACT GCG TCA TCG CCA GGT AAA CCG CCG 647 

bRLRNRH *LDSPTASSPGKPp 25 

648 GCA CTA ACG CCA GCA ACC AAC CCG TGA AGAC CAAC C A*\.C GGCAC CTGC GC AGGT T GCGGC TCAACC GC AT C 718 
AijTPATNP * _ . 

34 

719 ATG AAC TGC TGG ATT TCG GAC TCC CCG TAC TCT CGC GCA GTG CGT GCC CGC GAG CCT AT 778 
1MN CWISDSPYSR AVRAREPT 20 

779 GAA GAT CGC GTG CAT GCG TTC GGC GTG GAC CGC ACA GCA CCT GGA GTT GGC GGC GCC GAG 838 

^lEDRVHAFGVDRTAPGVGGAE 40 

839 GGC CGA GAT GGC AGG ATG ACG GAT CGT CGG GGG CGG GAA CTC CCA GGC CGC CGG ACC GTC 898 

41GRDGRMTDRRGRELPGRRTV 60 

8 « f* » CG l C ° CAA ACC CGT CGC CCG TAA GGAGTCATCC ATG AAG ACA GGC ACC GCG 959 

61ANPSQTRRKP* MKTGTA 6 

960 ACG ACG CGG CGC AGG CTG TTG GCA GTA CTG ATC GCC CTC GCG TTG CCG GGG GCC GCC GTT 1019 
/TTRR R1'I'AVLIALALPGAAV26 

1020 GCG CTG CTG GCC GAA CCA TCA GCG ACC GGC GCG TCG GAC CCG TGC GCG GCC AGC GAA GTG 1079 
l/ALLAE P SATGAS D PCAAS EV 46 

1080 GCG AGG ACG GTC GGT TCG GTC GCC AAG TCG ATG GGC GAC TAC CTG GAT TCA CAC CCA GAG 1139 
4/ARTVGSVAKSMGDYLDSHPE 66 

1140 ACC AAC CAG GTG ATG ACC GCG GTC TTG CAG CAG CAG GTA GGG CCG GGG TCG GTC GCA TCG 1199 
61 NQVMT AVLQQQVGPGSVAS 86 

1200 CTG AAG GCC CAT TTC GAG GCG AAT CCC AAG GTC GCA TCG GAT CC i,*-> 
87LKAHFEAN PKVAS D { 0Q 



SEQ ID N° 1 



FIGURE 1 

FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



, CT/FR98/01813 



2/185 



Insert du clone contenant DP428 et contenu dans seql 
1/1 31/11 



GAT CGC 


CTT 


TGA 


CGC 


CTA 


TTC 


GGT 


CGC 


GCA 


GCT TTT 


TGG 


CGA 


CGT CAC 


TGG TGC 


CCG 


CGT 


asp arg 


leu 


CPA 


arg 


leu 


phe 


gly 


arg 


ala 


ala phe 


trp 


arg 


arg his 


trp cys 


pro 


arg 


61/21 


















91/31 








TGC GGG 


CGT 


CCA 


GCC 


GCA 


GCG 


ACA 


CCA 


CAT 


ACG GCC 


GGT 


CCG 


GTT GCG 


GGG GCC 


GTT 


GGG 


cys gly 


arg 


pro 


ala 


ala 


ala 


thr 


pro 


his 


thr ala 


gly 


pro 


val ala 


gly ala 


val 




121/41 


















151/51 








TGG GGT 


TGG 


GTG 


CCT 


CCG 


TCA 


CCC 


CAG 


GCA 


GTT CGC 


TGG 


CTA 


TTT GTC 


GCA GTA 


GCG 


CGA 


trp gly 


trp 


val 


pro 


pro 


ser 


pro 


gin 


ala 


val arg 


trp 


leu 


phe val 


ala val 


ala 


ara 


181/61 


















211/71 










CGG CAT 


TGT 


CGA 


TGT 


CTT 


GGT 


AGC 


TAG 


CAT 


CCG GTC 


GGG 


GGG 


CCG CTA 


CCA GCG 


CCA 


GCG 


arg his 


cys 


arg 


cys 


leu 


gly 


ser 


AMB 


his 


pro val 


gly 


gly 


pro leu 


pro ala 


pro 


ala 


241/81 


















271/91 








CCG GGG 


CTC 


CCC 


GGT 


CCG 


GGT 


AGT 


GCG 


CGT 


CGA GTT 


GGT 


CGT 


GGA CCA 


GCA ATG 


ACT 


GCG 


pro gly 


leu 


pro 


gly 


pro 


gly 


ser 


ala 


arg 


arg val 


gly 


arg 


gly pro 


ala met 


thr 


ala 


301/101 


















331/111 








ACC CGG 


CGA 


CTT 


CGA 


AAC 


CGC 


CAC 


CGG 


TTA 


GAT TCC 


CCG 


ACT 


GCG TCA 


TCG CCA 


GGT 


AAA 


thr arg 


arg 


leu 


arg 


asn 


arg 


his 


arg 


leu 


asp ser 


pro 


thr 


ala ser 


ser pro 


al v 


lvs 


361/121 


















391/131 








CCG CCG 


GCA 


CTA 


ACG 


CCA 


GCA 


ACC 


AAC 


CCG 


TGA AGA 


CCA 


ACC 


AAC GGC 


ACC TGC 


GCA 


GGT 


pro pro 


ala 


leu 


thr 


pro 


ala 


thr 


asn 


pro 


OPA arg 


pro 


thr 


asn gly 


thr cys 


ala 


al v 


421/141 


















451/151 








TGC GGC 


TCA 


ACC 


GCA 


TCA 


TGA 


ACT 


GCT 


GGA 


TTT CGG 


ACT 


CCC 


CGT ACT 


CTC GCG 


CAG 


TGC 


cys gly 


ser 


thr 


ala 


ser 


OPA 


thr 


ala 


gly 


phe arg 


thr 


pro 


arg thr 


leu ala 


gin 


cys 


481/161 


















511/171 








GTG CCC 


GCG 


AGC 


CTA 


CCG 


AAG 


ATC 


GCG 


TGC 


ATG CGT 


TCG 


GCG 


TGG ACC 


GCA CAG 


CAC 


CTG 


val pro 


ala 


ser 


leu 


pro 


lys 


ile 


ala 


cys 


met arg 


ser 


ala 


trp thr 


ala gin 


his 


leu 


541/181 


















571/191 










GAG TTG 


GCG 


GCG 


CCG 


AGG 


GCC 


GAG 


ATG 


GCA 


GGA TGA 


CGG 


ATC 


GTC GGG 


GGC GGG 


AAC 


TCC 


glu leu 


ala 


ala 


pro 


arg 


ala 


glu 


met 


ala 


gly OPA 


arg 


ile 


val gly 


gly gly 


asn 


ser 


601/201 


















63V211 










CAG GCC 


GCC 


GGA 


CCG 


TCG 


CAA 


ACC 


CGT 


CGC 


AAA CCC 


GTC 


GCA 


AAC CGT 


AAG GAG 


TCA 


TCC 


gin ala 


ala 


gly 


pro 


ser 


gin 


thr 


arg 


arg 


lys pro 


val 


ala 


asn arg 


lys glu 


ser 


ser 


661/221 


















691/231 










ATG AAG 


ACA 


GGC 


ACC 


GCG 


ACG 


ACG 


CGG 


CGC 


AGG CTG 


TTG 


GCA 


GTA CTG 


ATC GCC 


CTC 


GCG 


roet lys 


thr 


giy 


thr 


ala 


thr 


thr 


arg 


arg 


arg leu 


leu 


ala 


val leu 


ile ala 


leu 


ala 


721/241 


















751/251 












TTG CCG 


GGG 


GCC 


GCC 


GTT 


GCG 


CTG 


CTG 


GCC 


GAA CCA 


TCA 


GCG 


ACC GGC 


GCG TCG 


GAC 


CCG 


leu pro 


gly 


ala 


ala 


val 


ala 


leu 


leu 


ala 


glu pro 


ser 


ala 


thr gly 


ala ser 


asp 


pro 


781/261 


















811/271 








TGC GCG 


GCC 


AGC 


GAA 


GTG 


GCG 


AGG 


ACG 


GTC 


GGT TCG 


GTC 


GCC 


AAG TCG 


ATG GGC 


GAC 


TAC 


cys ala 


ala 


ser 


glu 


val 


ala 


arg 


thr 


val 


gly ser 


val 


ala 


lys ser 


met gly 


asp 


tyr 


841/281 


















871/291 






CTG GAT 


TCA 


CAC 


CCA 


GAG 


ACC 


AAC 


CAG 


GTG 


ATG ACC 


GCG 


GTC 


TTG CAG 


CAG CAG 


GTA 


GGG 


leu asp 


ser 


his 


pro 


glu 


thr 


asn 


gin 


val 


met thr 


ala 


val 


leu gin 


gin gin 


val 


gly 


901/301 


















931/311 








CCG GGG 


TCG 


GTC 


GCA 


TCG 


CTG 


AAG 


GCC 


CAT 


TTC GAG 


GCG 


AAT 


CCC AAG 


GTC GCA 


TCG 


GAT 


pro gly 


ser 


val 


ala 


ser 


leu 


lys 


ala 


his 


phe glu 


ala 


asn 


pro lys 


val ala 


ser 


asp 



SEQ ID N° 1A» 
FIGURE 1A' 



FEUILLE DE REMPLACEMENT (REGLE 26) 




WO 99/09186 ^TCT/FR98/01813 

3/185 



Insert du clone contenant DP428, autre phase de lecture 
2/1 32/11 



62/21 
GCG GGC 
ala gly 
122/41 
GGG GTT 
gly val 
182/61 
GGC ATT 
gly ile 
242/81 
CGG GGC 
arg gly 
302/101 
CCC GGC 
pro gly 
362/121 
CGC CGG 
arg arg 
422/141 
GCG GCT 
ala ala 
482/161 
TGC CCG 
cys pro 
542/181 
AGT TGG 
ser trp 
602/201 
AGG CCG 
arg pro 
662/221 
TGA AGA 
OPA arg 
722/241 
TGC CGG 
cys arg 
782/261 
GCG CGG 
ala arg 
842/281 
TGG ATT 
trp ile 
902/301 



TTT 


GAC 


GCC 


TAT 


TCG 


GTC 


GCG 


CAG CTT TTT 


GGC 


GAC 


GTC 


ACT 


GGT 


GCC 


CGC 


GTT 


phe 


asp 


ala 


tyr 


ser 


val 


ala 


gin leu phe 


gly 


asp 


val 


thr 


Ol V 


ala 


arg 


val 
















92/31 














GTC 


CAG 


CCG 


CAG 


CGA 


CAC 


CAC 


ATA CGG CCG 


GTC 


CGG 


TTG 


CGG 


GGG 


CCG 


TTG 


GGT 


val 


gin 


pro gin 


arg 


his 


his 


ile arg pro 


val 


arg 


leu 


arcr 


crlv 


pro 


leu gly 
















152/51 












GGG 


TGC 


CTC 


CGT 


CAC 


CCC 


AGG 


CAG TTC GCT 


GGC 


TAT 


TTG 


TCG 


CAG 


TAG 


CGC 


GAC 


gly 


cys 


leu 


arg 


his 


pro 


arg 


gin phe ala 




tyr 


leu 


ser 


gin 


AMB 


arg 


asp 
















212/71 














GTC 


GAT 


GTC 


TTG 


GTA 


GCT 


AGC 


ATC CGG TCG 


GGG 


GGC 


CGC 


TAC 


CAG 


CGC 


CAG 


CGC 


val 


asp 


val 


leu 


val 


ala 


ser 


ile arg ser gly 


gly arg 


tvr 


gin 


arg 


gin 


arg 
















272/91 












TCC 


CCG 


GTC 


CGG 


GTA 


GTG 


CGC 


GTC GAG TTG 


GTC 


GTG 


GAC 


CAG 


CAA 


TGA 


CTG 


CGA 


ser 


pro 


val 


arg 


val 


val 


arg 


val glu leu val 


val 


asp 


aln 


aln 


OPA 


leu 


arg 
















332/111 














GAC 


TTC 


GAA ACC 


GCC 


ACC 


GGT 


TAG ATT CCC 


CGA 


CTG 


CGT 


CAT 


CGC 


CAG 


GTA 


AAC 


asp 


phe 


glu thr 


ala 


thr gly 


AMB ile pro 


arg 


leu 


arg 


his 


arg 




val 


asn 
















392/131 














CAC 


TAA 


CGC 


CAG 


CAA 


CCA ACC 


CGT GAA GAC 


CAA 


CCA ACG 


GCA 


CCT 


GCG 


CAG 


GTT 


his 


OCH 


arg gin 


gin pro 


thr 


arg glu asp gin 


pro 


thr 


ala 


pro 


ala 


gin val 
















452/151 
















CAA 


CCG 


CAT 


CAT 


GAA 


CTG 


CTG 


GAT TTC GGA 


CTC 


CCC 


GTA 


CTC 


TCG 


CGC 


AGT 


GCG 


gin 


pro 


his 


his 


glu leu leu 


asp phe gly leu 


pro 


val 


leu 


ser 


ara 


ser 


ala 
















512/171 
















CGA 


GCC 


TAC 


CGA 


AGA 


TCG 


CGT 


GCA TGC GTT 


CGG 


CGT 


GGA 


CCG 


CAC 


AGC 


ACC 


TGG 


arg 


ala 


tyr 


arg 


arg 


ser 


arg 


ala cys val 


arg 


arg gly 


pro 


his 


ser 


thr 


trp 
















572/191 














-CGG 


CGC 


CGA 


GGG 


CCG 


AGA 


TGG 


CAG GAT GAC 


GGA 


TCG 


TCG 


GGG 


GCG 


GGA 


ACT 


CCC 


arg 


arg 


arg gly 


pro arg trp 


gin asp asp 


gly 


ser 


ser 


olv 


ala 


alv 


thr 


pro 
















632/211 












CCG 


GAC 


CGT 


CGC 


AAA 


CCC 


GTC 


GCA AAC CCG 


TCG 


CAA ACC 


GTA 


AGG 


AGT 


CAT 


CCA 


pro 


asp 


arg 


arg 


lys pro val 


ala asn pro 


ser 


gin thr 


val 


arg 


ser 


his 


pro 
















692/231 














CAG 


GCA 


CCG 


CGA 


CGA 


CGC 


GGC 


GCA GGC TGT 


TGG 


CAG 


TAC 


TGA 


TCG 


CCC 


TCG 


CGT 


gin 


ala 


pro 


arg 


arg 


arg 


gly 


ala gly cys 


trp 


gin 


tyr 


OPA 


ser 


pro 


ser 


arg 
















752/251 














GGG 


CCG 


CCG 


TTG 


CGC 


TGC 


TGG 


CCG AAC CAT 


CAG 


CGA 


CCG 


GCG 


CGT 


CGG 


ACC 


CGT 


gly 


pro 


pro 


leu 


arg 


cys 


trp 


pro asn his 


gin 


arg 


pro 


ala 


arg 


arg 


thr 


arg 
















812/271 












CCA 


GCG 


AAG 


TGG 


CGA 


GGA 


CGG 


TCG GTT CGG 


TCG 


CCA AGT 


CGA 


TGG 


GCG 


ACT ACC 


pro 


ala 


lys 


trp 


arg 


gly 


arg 


ser val arg 


ser 


pro 


ser 


arg 


trp 


ala 


thr 


thr 
















872/291 














CAC 


ACC 


CAG 


AGA 


CCA ACC 


AGG 


TGA TGA CCG CGG 


TCT 


TGC 


AGC 


AGC 


AGG 


TAG 


GGC 


his 


thr 


gin arg 


pro 


thr 


arg 


OPA OPA pro 


arg 


ser 


cys 


ser 


ser 


arg 


AM3 


gly 
















932/311 














CGG 


TCG 


CAT 


CGC 


TGA AGG 


CCC 


ATT TCG AGG 


CGA 


ATC 


CCA 


AGG 


TCG 


CAT 


CGG 


ATC 


arg 


ser 


his 


arg 


OPA 


arg 


pro 


ile ser arg 


arg 


ile 


pro 


arg 


ser 


his 


arg 


ile 



SEQ ID N° IB' 
FIGURE IB 1 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



VFR98/01813 



4/185 



SeqlC: Insert du clone DP428, autre 


phase de lecture 














3/1 














33/11 


















TCG CCT TTG 


ACG 


CCT 


ATT 


CGG 


TCG 


CGC 


AGC TTT TTG 


GCG 


ACG 


TCA 


CTG 


GTG 


CCC 


GCG 


TTG 


ser pro leu 


thr 


pro 


ile 


arg 


ser 


arg 


ser phe leu 


ala 


thr 


ser 


leu 


val 


i. V 


aid 


leu 


63/21 














93/31 














CGG GCG TCC 


AGC 


CGC 


AGC 


GAC 


ACC 


ACA 


TAC GGC CGG 


TCC 


GGT 


TGC 


GGG 


GGC 


CGT 


TGG 


GTG 


arg ala ser 
123/41 


ser 


arg 


ser 


asp 


thr 


thr 


tyr gly arq 
153/51 


ser 


gly cys 


alv 
y ly 


yxy 


a rg 


tip 


vai 


GGG TTG GGT 


GCC 


TCC 


GTC 


ACC 


CCA 


GGC 


AGT TCG CTG 


GCT 


Ai 1 


TGT 


CGC 


AGT 


AGC 


GCG 


ACG 


gly leu gly 


ala 


ser 


val 


thr 


pro 


gly 


ser ser leu 


ala 


ile 


cys 


arg 


ser 


ser 


aid 


tnr 


183/61 














213/71 










GCA TTG TCG 


ATG 


TCT 


TGG 


TAG 


CTA 


GCA 


TCC GGT CGG 






GCT 


ACC 


AGC 


GCC 


AGC 


GCC 


ala leu ser 


met 


ser 


trp 


AMB 


leu 


ala 


ser gly arg 


al v 


ala 


ala 


thr 


ser 


ala 


ser 


ala 


243/81 














273/91 












GGG GCT CCC 


CGG 


TCC 


GGG 


TAG 


TGC 


GCG 


TCG AGT TGG 


TCG 


TfZfZ 




AGC 


AAT 


GAC 


TGC 


GAC 


gly ala pro 
303/101 


arg 


ser 


gly 


AMB 


cys 


ala 


ser ser trp 
333/111 


se r 


trp 


thr 


ser 


asn 


asp 


cys 


asp 


CCG GCG ACT 


TCG 


AAA 


CCG 


CCA 


CCG 


GTT 


AGA TTC CCC 


GAC 






ATC 


GCC 


AGG 


TAA 


ACC 


pro ala thr 


ser 


lys 


pro 


pro 


pro 


val 


arc ohe nro 


asp 


cys 


val 


ile 


ala 


arg 




tnr 


363/121 














393/131 














GCC GGC ACT 


AAC 


GCC 


AGC 


AAC 


CAA 


CCC 


GTG AAG ACT 




PAH 




CAC 


CTG 


CGC 


AGG 


TTG 


ala gly thr 
423/141 


asn 


ala 


ser 


asn 


gin 


pro 


val lys thr 
453/151 


asn 


gin 


arg 


hi < 

ills 


leu 


arg 


arg 


leu 


CGG CTC AAC 


CGC 


ATC 


ATG 


AAC 


TGC 


TGG 


ATT TCG GAC 


*rcc 

1 


CCG 


TAC 


TCT 


CGC 


GCA 


GTG 


CGT 


arg leu asn 
483/161 


arg 


ile 


met 


asn 


cvs 


tro 


ile ser asp 
513/171 


ser 


pro 


tyr 


ser 


arg 


ala 


... i 
vai 


arg 


GCC CGC GAG 


CCT 


ACC 


GAA 


GAT 


CGC 


GTG 


CAT GCG TTC 


GGC 


GTG 


GAC 


CGC 


ACA 


GCA 


CCT 


GGA 


ala arg glu 
543/181 


pro 


thr 


glu 


asp 


arg 


val 


his ala phe 
. 573/191 


al v 


val 


asp 


arg 




■ ala 


pro 


giy 


GTT GGC GGC 


GCC 


GAG 


GGC 


CGA 


GAT 


GGC 


AGG ATG ACG 


GAT 


CGT 


CGG 


GGG 


CGG 


GAA 


CTC 


CCA 


val gly gly 
603/201 


ala 


glu 


gly 


arg 


asp 


gly 


arg met thr 
633/211 


asD 


arg 


arg 




arg 




leu 


pro 


GGC CGC CGG 


•ACC 


GTC 


GCA 


AAC 


CCG 


TCG 


CAA ACC CGT 


CGC 


AAA 


CCG 


TAA 


GGA 


GTC 


ATC 


CAT 


gly arg arg 


thr 


val 


ala 


asn 


pro 


ser 


gin thr arg 


arg 


lys 


pro 


OCH 


oil/ 
yiy 


val 


lie 


ni s 


663/221 














693/231 








GAA GAC AGG 


CAC 


CGC 


GAC 


GAC 


GCG 


GCG 


CAG GCT GTT 


GGC 


AGT 


ACT 


GAT 


CGC 


CCT 


CGC 


GTT 


glu asp arg 
723/241 


his 


arg 


asp 


asp 


ala 


ala 


gin ala val 
753/251 


gly 


ser 


thr 


asp 


arg 


pro 


arg 


val 


GCC GGG GGC 


CGC 


CGT 


TGC 


GCT 


GCT 


GGC 


CGA ACC ATC 


AGC 


GAC 


CGG 


CGC 


GTC 


GGA 


CCC 


GTG 


ala gly gly 
783/261 


arg 


arg 


cys 


ala 


ala 


gly 


arg thr ile 
813/271 


ser 


asp 


arg 


arg 


val 


gly 


pro 


val 


CGC GGC CAG 


CGA 


AGT 


GGC 


GAG 


GAC 


GGT 


CGG TTC GGT 


CGC 


CAA 


GTC 


GAT 


GGG 


CGA 


CTA 


CCT 


arg gly gin 


arg 


ser 


gly 


glu 


asp 


gly 


arg phe gly 


arg 


gin val 


asp 


gly 


arg 


leu 


pro 


843/281 














873/291 










GGA TTC ACA CCC 


AGA 


GAC 


CAA 


CCA 


GGT 


GAT GAC CGC 


GGT 


CTT 


GCA 


GCA 


GCA 


GGT 


AGG 


GCC 


gly phe thr 
903/301 


pro 


arg 


asp 


gin 


pro 


gly 


asp asp arg 
933/311 


gly 


leu 


ala 


ala 


ala 


gly 


arg 


aia 


GGG GTC GGT 


CGC 


ATC 


GCT 


GAA 


GGC 


CCA 


TTT CGA GGC 


GAA 


TCC 


CAA 


GGT 


CGC 


ATC 


GGA 


TC 


gly val gly arg 


ile 


ala 


glu 


gly 


pro 


phe arg gly 


glu 


ser 


gin 


gly 


arg 


ile 


gly 



SEQ ID N° 1C 
FIGURE 1C 

FEUILLE DE REMPLACEMENT (REGLE 26) 










31/11 


















ACG ACG 


CGG 


CGC 


AGG CTG 


TTG 


GCA 


GTA 


CTG 


ATC 




CTC 
V* 1 1~ 


GCG 


thr thr 


arg 


ara 


arg leu 


leu 


axel 


vax 


leu 


ile 


ala 


leu 


ala 








91/31 
















GCG CTG 


CTG 


GCC 


GAA CCA 


TCA 


GCG 


ACC 


GGC 


GCG 


TCG 


GAC 


CCG 


ala leu 


leu 


ala 


yxu pro 


ser 


ala 


thr 


gly ala 


ser 


asp 


pro 








151/S1 

X«J X/ J x 














GCG AGG 


ACG 


GTC 


GGT TCG 


GTC 


GCC 


AAG 


TCG 


ATG 


GGC 


GAC 


TAT 


ala arg 


thr 


val 


gly ser 


val 


ala 


lys 


ser 


met 


gly 


asp 


tyr 








211/71 












ACC AAC 


CAG 


GTG 


ATG ACC 


GCG 


GTC 


TTG 


CAG 


CAG 


CAG 


GTA 


GGG 


thr asn gin 


val 


met thr 


ala 


val 


leu 


gin gin 


gin 


val 


gly 








271/91 














CTG AAG 


GCC 


CAT 


TTC GAG 


GCG 


AAT 


CCC 


AAG 


GTC 


GCA 


TCG 


GAT 


leu lys 


ala 


his 


phe glu 


ala 


asn 


pro 


lys 


val 


ala 


ser 


asp 








331/111 
















CCG CTG 


ACC 


GAT 


CTT TCG 


ACT 


CGG 


TGC 


TCG 


CTG 


CCG 


ATC 


AGC 


pro leu 


thr 


asp 


leu ser 


thr 


arg 


cys 


ser 


leu 


pro 


ile 


ser 








391/131 














TTG ATG 


CAG 


GCG 


GTG CAG 


GGC 


GCC 


CGC 


CGG 


TAG 








leu met gin 


ala 


val gin 


gly 


ala 


arg 


arg 


AMB 









WD 99/09186 W ^Fr/FR98/01813 



5/185 

Sequence codante DP428 identique a la sequence Rv0203 predite par Cole et al 
(Nature 393:537-544) 
1/1 

ATG AAG ACA GGC ACC ( 
Met lys thr gly thr a 
61/21 

TTG CCG GGG GCC GCC C 
leu pro gly ala ala \ 
121/41 

TGC GCG GCC AGC GAA ( 
cys ala ala ser glu \ 
181/61 

CTG GAT TCA CAC CCA C 
leu asp ser his pro c 
241/81 

CCG GGG TCG GTC GCA 1 
pro gly ser val ala < 
301/101 

CTG CAC GCG CTT TCG C 
leu his ala leu ser c 
361/121 



SEQ ID N° ID 
FIGURE ID 

ORF contenant la sequence DP428 et faisant partie de seqlA' 
1/1 ' 31/11 

TGA CGG ATC GTC GGG GGC GGG AAC TCC CAG GCC GCC GGA CCG TCG CAA ACC CGT CGC AAA 
OPA arg ile val gly gly gly asn ser gin ala ala gly oro ser gin thr arg arc lys 
61/21 91/ 31 

CCC GTC GCA AAC CGT AAG GAG TCA TCC ATG AAG ACA GGC ACC GCG ACG ACG CGG CGC AGG 
pro val ala asn arg lys glu ser ser met lys thr gly thr ala thr thr arg arg arg 
121/41 151/51 

CTG TTG GCA GTA CTG ATC GCC CTC GCG TTG CCG GGG GCC GCC GTT GCG CTG CTG GCC GAA 
leu leu ala val leu ile ala leu ala leu pro gly ala ala val ala leu leu ala olu 
181/61 211/71 

CCA TCA GCG ACC GGC GCG TCG GAC CCG TGC GCG GCC AGC GAA GTG GCG AGG ACG GTC GGT 
pro ser ala thr gly ala ser asp pro cys ala ala ser glu val ala arg thr val qW 
241/81 271/91 " 

TCG GTC GCC AAG TCG ATG GGC GAC TAC CTG GAT TCA CAC CCA GAG ACC. AAC CAG GTG ATG 
ser val ala lys ser met gly asp tyr leu asp ser his Dro glu thr asn gin val met 
301/101 331/111 

ACC GCG GTC TTG CAG CAG CAG GTA GGG CCG GGG TCG GTC GCA TCG CTG AAG GCC CAT TTC 
thr ala val leu gin gin gin val gly pro gly ser val ala ser leu lys ala his oh* 
361/121 391/131 

GAG GCG AAT CCC AAG GTC GCA TCG GAT CTG CAC GCG CTT TCG CAA CCG CTG ACC GAT CTT 
glu ala asn pro lys val ala ser asp leu his ala leu ser gin pro leu thr aso leu 
421/141 451/151 

TCG ACT CGG TGC TCG CTG CCG ATC AGC GGC CTG CAG GCG ATC GGT TTG ATG CAG GCG GTG 
ser thr arg cys ser leu pro ile ser gly leu gin ala ile gly leu met gin ala val 
481/161 

CAG GGC GCC CGC CGG TAG 
gin gly ala arg arg AMB 

SEQ ID N° IF 



FEUILLE DE REMf*i5g5B6iE^f (REGLE 26) 



WO 99/09186 

6/185 



4 91 CCGGTCGGGGGGCCGCTACCAGCGCCAGCGCCGGGGCTCCCCGGTCCGGGTA GTG CGC GTC GAG TTG GTC GTG 
1 VRVBLVV 



563 
7 



564 GAC CAG CAA TGA CTGCGACCCGi 
8 0 Q Q ♦ 



Gc jjAGTT* 



CGAAACCGCCACCGGTTAGATTCCCCGACTGCGTCA r 



HAA 639 



640 ACCGCCGGCACTAACGCCAGCAACCAACCC GTG AAG ACC AAC CAA CGG CAC CTG CGC AGG TTG CGG 
1 V KTNQRHLRRLR 



705 

12 



706 
13 


CTC 
L 


AAC 
N 


CGC 
R 


ATC 
I 


ATG 
M 


AAC 
N 


TGC 
C 


TGG 
W 


ATT 
I 


TCG 
S 


GAC 
D 


TCC 
S 


CCG 
P 


TAC 
Y 


TCT CGC GCA GTG CGT GCC 
S R A V R A 


765 
32 


766 
33 


CGC 
R 


GAG 
E 


CCT 
P 


ACC 
T 


GAA 
E 


GAT 
D 


CGC 
R 


GTG 
V 


CAT 
H 


GCG 
A 


TTC 
F 


GGC 
G 


GTG 
V 


GAC 
D 


CGC ACA GCA CCT GGA GTT 
R T A P G V 


825 
52 


826 
53 


GGC 
G 


GGC 
G 


GCC 
A 


GAG 
E 


GGC 
G 


CGA 
R 


GAT 
0 


GGC 
G 


AGG 
R 


ATG 
M 


ACG 
T 


GAT 
0 


CGT 
R 


CGG 
R ' 


GGG CGG GAA CTC CCA GGC 
G R E L P G 


835 
72 


896 
73 


CGC 
R 


CGG 
R 


ACC 
T 


GTC 
V 


GCA 
A 


AAC 
N 


CCG 
P 


TCG 
S 


CAA 
Q 


ACC 

T 


CGT 
R 


CGC 
R 


AAA 
K 


CCG 
P 


TAA GGAGTCATCC ATG AAG 
* xxxxxx M x 


946 

2 


947 
3 


ACA 
T 


GGC 
G 


ACC 
T 


GCG 
A 


ACG 
T 


ACG 
T 


CGG 
R 


CGC 
R 


AGG 
R 


CTG 
L 


TTG 
L 


GCA 
A 


GTA 
V 


CTG 
L 


ATC GCC CTC GCG TTG CCG 
I A L A L P 


1006 
22 



1007 GGG GCC GCC GTT 
23 G A A V A 



go; 



CTG CTG GCC GAA CCA TCA GCG ACC GGC GCG TCG GAC CCG TGC GCG 
ILASPSATC A S 0 P C A 



1066 
42 



1126 
62 



1166 
82 



1067 GCC AGC GAA GTG Gck AGG ACG GTC GGT TCG GTC GCC AAG TCG ATG GGC GAC TAC CTG GAT 
43ASEVARTVGSVAKSMGDYLD 

1127 TCA CAC CCA GAG ACC AAC CAG GTG ATG ACC GCG GTC TTG CAG CAG CAG GTA GGG CCG GGG 
63 S H PETNQVMTAVLQQQVG P G 



1137 TCG GTC GCA TCG CTG AAG GCC CAT TTC GAG GCG- AAT CCC AAG GTC GCA TCG GAT CTG CAC 

83 S V A S LKAH F £ A N PKVASDLH 

1247 GCG CTT TCG CAA CCG CTG ACC GAT CTT TCG ACT CGG TGC TCG CTG CCG ATC AGC GGC CTG 

103 A L S Q P L T D L S T R C S |l P I S |g | L 

1307 CAG GCG ATC GGT TTG ATG CAG GCG GTG CAG GGC GCC CGC CGG TAG ATG CCG GAC CGC CGC 

123 QAIG LMQAVQGARRj * M ? D R R 



1246 
102 



13C6 
122 



1355 
5 



1367 CGG GTC CGG CGC AGT CGA CGT GAG GCA GCG GTC GCC TAC CGG GGC GGT GTC TCG CCG CCT 
6RVRR S R REAAVAY RGGVS P ? 

14 27 TCT GGT CGC AGG TCA GGG GTC GGC GCT GGA CCT TGC GGT GTG GTT TCG ACC GGG TCG TCG 
26 S G R R S GVGAG PCGVVSTG S S 

1437 CAG GGT GTG CCC TGC GGT TGG ATG ACA AGT CGC AGG TTT GGA TCG GTT GGC GGG TCG CGA 
46QGVPCGWMTSRRFGSVGGSR 



1426 
25 



1436 
45 



1546 
65 



1547 TCG TTG T 
66 S L 



1553 
67 



SEQ ID N° 2 



FIGURE 2 



FEUILLE DE REMPLACEMENT (REGLE 26) 




WO 99/09186 ^Wt/FR98/01813 



7/185 



TCG CCG GCT CGC GGA CGT AGA 
ser pro ala arg gly arg arg 
61/21 

TGA CTG CCG GGC TTG ACG CGG 
OPA leu pro gly leu thr arg 
121/41 

TGA CCT GGG GTG CGT GGG CGC 
OPA pro gly val arg gly arg 
181/61 

CTC GGT CGC CGG CAG TGT CAG 
leu qly arq arq qln cys gin 
241/81 

TCG TGG TTG CGA CGA CTT GGC 

ser trp leu arg arg leu gly 

301/101 

GAT C 

asp 









31/11 




TAA TAG 


CTC 


ACC GTT 


GGA 


OCH 


AMB 


leu 


thr val gly 








91/31 




ACG 


ACC 


ACA 


GAG TCG 


GGT 


thr 


thr 


thr 


glu ser 


gly 








151/51 




CGA 


CGA 


GTG 


AGG CAG 


TCA 


arg 


arg 


val 


arg gin 


ser 








211/71 




CAT 


GTG 


CAG 


ATG ACT 


CCA 


his 


val 


gin 


met thr 


pro 








271/91 




GCT 


GGT 


GAG 


CGC ACC 


CGC 


ala gly 


glu 


arg thr 


arg 



SEQ ID N° 3A 
FIGURE 3A 



CGA 


CCT 


CGA CAG 


GGT 


CCT 


TTG 


arg 


pro 


arg gin gly pro 


leu 


CAT 


CGC 


CTA AGG 


CTA 


CCG 


TTC 


his 


arg 


leu arg 


leu 


pro 


phe 


TGT 


CTC 


AGG GCC 


CAC 


CGC 


CAC 


cys 


leu 


arg ala 


his 


arg 


his 


CGC 


AGC 


TTG TTC 


GTG 


TTG 


GTG 


arg 


ser 


leu phe val leu 


val 


CGG 


CGT 


CGT GCC 


GCG 


CAT 


GCG 


arg 


arg 


arg ala 


ala 


his 


ala 



CGC CGG CTC GCG 
arg arg leu ala 
62/21 

GAC TGC CGG GCT 
asp cys arg ala 
122/41 

GAC CTG GGG TGC 
asp leu gly cys 
182/61 

TCG GTC GCC GGC 
ser val ala gly 
242/81 

CGT GGT TGC GAC 

arg gly cys asp 

302/101 

ATC 

ile 



GAC GTA GAT AAT 
asp val asp asn 

TGA CGC GGA CGA 
OPA arg gly arg 

GTG GGC GCC GAC 
val gly ala asp 

AGT GTC AGC ATG 
ser val ser met 

GAC TTG GCG CTG 
asp leu ala leu 







32/11 


AGC 


TCA 


CCG TTG 


ser 


ser 


pro leu 






92/31 


CCA 


CAG 


AGT CGG 


pro 


gin 


ser arg 






152/51 


GAG 


TGA 


GGC AGT 


glu 


OPA 


gly ser 






212/71 


TGC 


AGA 


TGA CTC 


cys 


arg 


OPA leu 






272/91 


GTG 


AGC 


GCA CCC 


val 


ser 


ala pro 



SEQ ID N° 3B 
FIGURE 3B 



GAC GAC CTC GAC 
asp asp leu asp 

GTC ATC GCC TAA 
val ile ala OCH 

CAT GTC TCA GGG 
his val ser gly 

CAC GCA GCT TGT 
his ala ala cys 

GCC GGC GTC GTG 
ala gly val val 



AGG GTC CTT TGT 
arg val leu cys 

GGC TAC CGT TCT 
gly tyr arg ser 

CCC ACC GCC ACC 
pro thr ala thr 

TCG TGT TGG TGT 
ser cys trp cys 

CCG CGC ATG CGG 
pro arg met arg 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



7FR98/01813 



8/185 



GCC GGC TCG CGG 
ala gly ser arg 
63/21 

ACT GCC GGG CTT 
thr ala gly leu 
123/41 

ACC TGG GGT GCG 
thr trp gly ala 
183/61 

CGG TCG CCG GCA 
arg ser pro ala 
243/81 

GTG GTT GCG ACG 
val val ala thr 

TC 



ACG TAG ATA ATA 
thr AMB ile ile 

GAC GCG GAC GAC 
asp ala asp asp 

TGG GCG CCG ACG 
trp ala pro thr 

GTG TCA GCA TGT 
val ser ala cys 

ACT TGG CGC TGG 
thr trp arg trp 



33/11 
GCT CAC CGT TGG 
ala his arg trp 

93/31 
CAC AGA GTC GGG 
his arg val gly 

153/51 
AGT GAG GCA GTC 
ser glu ala val 

213/71 
GCA GAT GAC TCC 
ala asp asp ser 

273/91 
TGA GCG CAC CCG 
OPA ala his pro 



ACG ACC TCG ACA 
thr thr ser thr 

TCA TCG CCT AAG 
ser ser pro lys 

ATG TCT CAG GGC 
met ser gin gly 

ACG CAG CTT GTT 
thr gin leu val 

CCG GCG TCG TGC 
pro ala ser cys 



GGG 


TCC 


TTT GTG 


gly 


ser 


phe val 


GCT 


ACC 


GTT CTG 


ala 


thr 


val leu 


CCA 


CCG 


CCA CCT 


pro 


pro 


pro pro 


CGT 


GTT 


GGT GTC 


arg 


val 


gly val 


CGC 


GCA 


TGC GGA 


arg 


ala 


cys gly 



SEQ ID N° 3C 
FIGURE 3C 



CCA ATT TTC CTT 
pro ile phe leu 
61/21 

GTC GCG CAG CTT 
val ala gin leu 
121/41 

CGT CGC TCT CCA 
arg arg ser pro 
181/61 

GGC TGA GTG TCT 
gly OPA val ser 
241/81 

GTC CCC CGC GCG 
val pro arg ala 
301/101 

CAT TTC GCA GCA 
his phe ala ala 
361/121 

CGG ACG AGT CGT 
arg thr ser arg 



CGC 


GCC 


GTG 


CAA 


arg 


ala val gin 


GCG 


GAA ACC 


GGG 


ala 


glu 


thr gly 


CCC 


GTC 


GGG 


GGG 


pro 


val 


gly gly 


GCA 


GGG 


CTC 


CGG 


ala 


gly 


leu 


arg 


CGA 


CTT 


CCA 


GAC 


arg 


leu 


pro 


asp 


ACC 


GGT 


CTC 


CGG 


thr 


gly 


leu 


arg 


CGT 


CAA 


CGA 


CCA 


arg 


gin 


arg 


pro 







31/11 


TAC 


CAT 


CTG CAA 


tyr 


his 


leu gin 






91/31 


TAT 


GGA 


CCC TGC 


tyr 


gly 


pro cys 






151/51 


CGA 


AAG 


CCA TTC 


arg 


lys 


pro phe 






211/71 


GGA 


GCA 


GCC GAT 


gly 


ala 


ala asp 






271/91 


ATT 


TGT 


TGT GGT 


ile 


cys 


cys gly 






331/111 


GTC 


GCA 


GCA TCG 


val 


ala 


ala ser 



CGA TC 
arg 



SEQ ID N° 4A 
FIGURE 4A 



GAC CAG CGA CGG 
asp gin arg arg 

CGT ACC GTT GTT 
arg thr val val 

CGA CAC TGG GAT 
arg his trp asp 

CAT CAC CAT GTA 
his his his val 

TTC GGT TGA GGC 
phe gly OPA gly 

TTG CGG CGA TCG 
leu arg arg ser 



CCC 


GTG 


GTT 


GCG 


pro 


val 


val 


ala 


GCC 


ACT 


TGA 


TGT 


ala 


thr 


OPA 


cys 


CCT 


CAA 


AAC 


GTC 


pro 


gin 


asn 


val 


CGA 


ACT 


GAA TAA 


arg 


thr 


glu OCH 


CGA 


GGC 


GAG 


GCT 


arg 


gly 


glu 


ala 


CGG 


CGC 


AGT 


CGT 


arg 


arg 


ser 


arg 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



7FR98/01813 



9/185 



CAA TTT TCC TTC 
gin phe ser phe 
62/21 

TCG CGC AGC TTG 
ser arg ser leu 
122/41 

GTC GCT CTC CAC 
val ala leu his 
182/61 

GCT GAG TGT CTG 
ala glu cys leu 
242/81 

TCC CCC GCG CGC 
ser pro ala arg 
302/101 

ATT TCG CAG CAA 
ile ser gin gin 
362/121 

GGA CGA GTC GTC 
gly arg val val 



GCG CCG TGC AAT 
ala pro cys asn 

CGG AAA CCG GGT 
arg lys pro gly 

CCG TCG GGG GGC 
pro ser gly gly 

CAG GGC TCC GGG 
gin gly ser gly 

GAC TTC CAG ACA 
asp phe gin thr 

CCG GTC TCC GGG 
pro val ser gly 

GTC AAC GAC CAC 
val asn asp his 







32/11 


ACC 


ATC 


TGC AAG 


thr 


ile 


cys lys 






92/31 


ATG 


GAC 


CCT GCC 


met 


asp 


pro ala 






152/51 


GAA 


AGC 


CAT TCC 


glu 


ser 


his ser 






212/71 


GAG 


CAG 


CCG ATC 


glu 


gin 


pro ile 






272/91 


TTT 


GTT 


GTG GTT 


phe 


val 


val val 






332/111 


TCG 


CAG 


CAT CGT 


ser 


gin 


his arg 


GAT 


C 




asp 







SEQ ID N° 4B 
FIGURE 4B 



ACC AGC GAC GGC 
thr ser asp gly 

GTA CCG TTG TTG 
val pro leu leu 

GAC ACT GGG ATC 
asp thr gly ile 

ATC ACC ATG TAC 
ile thr met tyr 

TCG GTT GAG GCC 
ser val glu ala 

TGC GGC GAT CGC 
cys gly asp arg 



CCG TGG TTG CGG 
pro trp leu arg 

CCA CTT GAT GTC 
pro leu asp val 

CTC AAA ACG TCG 
leu lys thr ser 

GAA CTG AAT AAG 
glu leu asn lys 

GAG GCG AGG CTC 
glu ala arg leu 

GGC GCA GTC GTC 
gly ala val val 



AAT TTT CCT TCG CGC CGT GCA ATA CCA TCT 
asn phe pro ser arg arg ala ile pro ser 
63/21 

CGC GCA GCT TGC GGA AAC CGG GTA TGG ACC 
arg ala ala cys gly asn arg val trp thr 
123/41 

TCG CTC TCC ACC CGT CGG GGG GCG AAA GCC 
ser leu ser thr arg arg gly ala lys ala 
183/61 

CTG AGT GTC TGC AGG GCT CCG GGG AGC AGC 
leu ser val cys arg ala pro gly ser ser 
243/81 

CCC CCG CGC GCG ACT TCC AGA CAT TTG TTG 
pro pro arg ala thr ser arg his leu leu 
303/101 

TTT CGC AGC AAC CGG TCT CCG GGT CGC AGC 
phe arg ser asn arg ser pro gly arg ser 
363/121 

GAC GAG TCG TCG TCA ACG ACC ACG ATC 
asp glu ser ser ser thr thr thr ile 



33/11 

GCA AGA CCA GCG ACG GCC CGT GGT TGC GGT 
ala arg pro ala thr ala arg gly cys qlv 
93/31 * 
CTG CCG TAC CGT TGT TGC CAC TTG ATG TCG 
leu pro tyr arg cys cys his leu met ser 
153/51 

ATT CCG ACA CTG GGA TCC TCA AAA CGT CGG 
ile pro thr leu gly ser ser lys arg arg 
213/71 

CGA TCA TCA CCA TGT ACG AAC TGA ATA AGT 
arg ser ser pro cys thr asn OPA ile ser 
273/91 

TGG TTT CGG TTG AGG CCG AGG CGA GGC TCA 
trp phe arg leu arg pro arg arg gly ser 
333/111 

ATC GTT GCG GCG ATC GCG GCG CAG TCG TCG 
ile val ala ala ile ala ala gin ser ser 



SEQ ID N°. 4C 
FEUILLE DE REWlp[&5SilfE^F{REGLE 26) 



WO 99/09186 ^^I7FR98/01813 

10/185 



partie de la sequence nucleotidique de seq4A 
1/1 31/11 

CCG CGC GCG ACT TCC AGA CAT TTG TTG TGG TTT CGG TTG AGG CCG AGG CGA GGC TCA TTT 
pro arg ala thr ser arg his leu leu trp phe arg leu arg pro arg arg gly. ser phe 
61/21 91/31 

CGC AGC AAG CGG TCT CCG GGT CGC AGC ATC GTT GCG GCG ATC GCG GCG CAG TCG TCG GAC 

121/4i r aU Ue ala gln Ser Ser asp 

GAG TCG TCG TCA ACG ACC ACG ATC 
glu ser ser ser thr thr thr ile 



SEQ ID N° 4A f 
FIGURE 4A' 



1/1 

CGC GCG CGA CTT CCA GAC ATT 
arg ala arg leu pro asp ile 
61/21 

GCA GCA AGC GGT CTC CGG GTC 
ala ala ser gly leu arg val 
121/41 

AGT CGT CGT CAA CGA CCA CGA 
ser arg arg gin arg pro arg 



31/11 

TGT TGT GGT TTC GGT TGA 
cys cys gly phe gly OPA 
91/31 

GCA GCA TCG TTG CGG CGA 
ala ala ser leu arg arg 

TC 



SEQ ID N° 4B' 
FIGURE 4B' 



GGC CGA GGC GAG GCT CAT TTC 

gly arg gly glu ala his phe 

TCG CGG CGC AGT CGT CGG ACG 

ser arg arg ser arg arg thr 



1/1 

GCC GCG CGC GAC TTC 

ala ala arg asp phe 
61/21 

TCG CAG CAA GCG GTC 

ser gin gin ala val 
121/41 

CGA GTC GTC GTC AAC 

arg val val val asn 



CAG ACA TTT GTT GTG 
gin thr phe val val 

TCC GGG TCG CAG CAT 
ser gly ser gin his 

GAC CAC GAT C 
asp his asp 



31/11 

GTT TCG GTT GAG GCC 
val ser val glu ala 
91/31 

CGT TGC GGC GAT CGC 
arg cys gly asp arg 



GAG GCG AGG CTC ATT 
glu ala arg leu ile 

GGC GCA GTC GTC GGA 
gly ala val val gly 



SEQ ID N° 4C 
FIGURE 4C 

FEUILLE DE REMPLACEMENT (REGLE 26) 




# 



WO 99/09186 ^^CT/FR98/01813 



11/185 

ORF d'apres par Cole et al. (Nature 393:537-544) et contenant la sequence Seq 

1/1 

tga ata 

tfwoi 16 " r ~ ^ u xeu U£ P P ne arg leu arq pro arc 

61/21 91/31 

cga ggc 

ff?,?^ SCr P arg Ser lyS arg ser pro *V ar * ser ile val ala ile ala ala 
121/41 

cag teg w^*, ^ y «v- y atg ate ccg aac teg acg ccc tec tqt tea 

gin ser ser asp glu ser ser ser thr thr thr ile ser asn ser thr pro ser cys ser 
181/61 211/71 

agg atg eta cgc aga cag cgc teg atg gtg gcg ccg ttg ttg tac ate ggg atg cac acc 

arg met 1 — — - * - y 

241/81 
gag ata 



301/101 
tgg cga 



















agt 


ccg ccg 


cgc 


gcg 


act 


tec 


aga 


cat ttg 


ser 


pro pro 


arg 


ala 


thr 


ser 


arg 


his leu 
















91/31 


tea 


ttt cgc 


age 


aag 


egg 


tct 


ccg 


ggt cgc 


ser 


phe arg 


ser 


lys 


arg 


ser 


pro 


gly arg 
















151/51 


teg 


gac gag 


teg 


teg 


tea 


acg 


acc 


acg ate 


ser 


asp glu 


ser 


ser 


ser 


thr 


thr 


thr ile 
















211/71 


eta 


cgc aga 


cag 


cgc teg atg 


gtg 


gcg ccg 


leu 


arg arg gin 


arg 


ser 


met 


val 


ala pro 
















271/91 


age 


ggt ttc 


gee 


ggg 


ttc 


acc 


gat 


acc acg 


ser 


gly phe 


ala 


gly phe thr 


asp 


thr thr 


etc 


aga gac 


tag 












leu 


arg asp 


AMB 













ggc acc aca 



SEQ ID N° 4F 
FIGURE 4F 

sequence en amont de seq4A' et en fusion avec seq4A' 
1/1 31/11 

GCA ACC TAC CAG CAG AGC CAG GGG CTC ACA GGA CCT AAA GGA GTA GCG CCC ATG GCT GAT 
ala thr tyr gin gin ser gin gly leu tht gly pro lys gly val ala pro met ala asp 

C 

SEQ ID N° 4J 
FIGURE 4J 

seq4J' dans une autre phase de lecture 

!/! 31/11 

ACG CAA CCT ACC AGC AGA GCC AGG GGC TCA CAG GAC CTA AAG GAG TAG CGC CCA TGG CTG 
thr gin pro thr ser arg ala arg gly ser gin asp leu lys glu AMB arg pro tro leu 
61/21 
ATC 

ile 

SEQ ID N°4K 
FIGURE 4K 

seq 4J' dans la troisieme phase de lecture 
1/1 31/11 

CGC AAC CTA CCA GCA GAG CCA GGG GCT CAC AGG ACC TAA AGG AGT AGC GCC CAT GGC TGA 
arg asn leu pro ala glu pro gly ala his arg thr OCH arg ser ser ala his gly OPA 

TC 

SEQ ID N° 4L 



FEUILLE DE REMpD&^E^f (REGLE 26) 



WO 99/09186 




:17FR98/01813 



12/185 



sequence Rv2050 
1/1 


predite 


par 


Cole et 


al. 


(Nature 
31/11 


393:537- 


-544) 


et 


contenant seq4J 


ATG GCT 


GAT 


CGT 


wiV* 


CTG 


AGG 




PiSjl 


CGC 


CTC GGA 


GCC 


GTG 


AGC 


TAT 


GAG 


ACC 


GAC 


CGC 


Met ala 
61/21 


asp 


arg 


\rpt 1 

vul 


leu 


arg 


9iy 


se r 


arg 


leu gly ala 
91/31 


val 


ser 


tyr 


glu 


thr 


asp 


arg 


AAC CAC 


GAC 


CTG 


GCG 


CCG 


CGC 


CAG 


ATC 


GCG 


CGG TAC 


CGC 


ACC 


GAC 


AAC 


GGC 


GAG 


GAG 


TTC 


asn his 
121/41 


asp 


leu 


ala 


pro 


arg 


gin 


ile 


ala 


arg tyr 
151/51 


arg 


thr 


asp 


asn 


gly 


glu 


glu 


phe 


GAA GTC 


CCG 


TTC 


GCC 


GAT 


GAC 


GCC 


GAG 


ATC 


CCC GGC 


ACC 


TGG 


TTG 


TGC 


CGC 


AAC 


GGC 


ATG 


glu val 
181/61 


pro 


phe 


ala 


asp 


asp 


ala 


glu 


ile 


pro gly 
211/71 


thr 


trp 


leu 


cys 


arg 


asn 


gly 


met 


GAA GGC 


ACC 


CTG 


ATC 


GAG 


GGC 


GAC 


CTG 


CCC 


GAG CCG 


AAG 


AAG 


GTT AAG 


CCG 


CCC 


CGG 


ACG 


glu gly 


thr 


leu 


ile 


glu 


gly 


asp 


leu 


pro 


glu pro lys 


lys 


val 


lys 


pro 


pro 


arg 


thr 


241/81 


















271/91 






CAC TGG 


GAC 


ATG 


CTG 


CTG 


GAG 


CGC 


CGT 


TCC 


ATC GAA 


GAA 


CTC 


GAA 


GAG 


TTA 


CTT 


AAG 


GAG 


his trp 
301/101 


asp 


met 


leu 


leu 


glu 


arg 


arg 


ser 


ile glu 
331/111 


glu 


leu 


glu glu 


leu 


leu 


lys 


glu 


CGC CTC 


GAG 


CTC 


ATT 


CGG 


TCA 


CGT 


CGG 


CGC 


GGC TGA 


















arg leu 


glu 


leu 


ile 


arg 


ser 


arg 


arg 


arg 


gly OPA 



















ORF d'apres par Cole et al . (Nature 393:537-544) et contenant la sequence Rv2050 
1/1 * 31/11 

TAG TCC GCC CGG GTG TCC GAT CCC GGT ATC ATT GAT GGT CGC GCC GCG CGC GTC GCG TGC 
AMB ser ala arg val ser asp pro gly ile ile asp gly arg ala ala arg val ala cvs 
61/21 91/31 

CGG GAA CTA CGC AGA CGG CCG CAG CGT TTG CCA ACC GGA GCC AGT CGC CAG TAC GCA ACC 
arg glu leu arg arg arg pro gin arg leu pro thr gly ala ser arg gin tyr ala thr 
121/41 151/51 

TAC CAG CAG AGC CCA GGG CTC ACA GGA CCT A<\A GGA GTA GCG CCC ATG GCT GAT CGT GTC 
tyr gin gin ser pro gly leu thr gly pro lys gly val ala pro met ala asp arg val 
181/61 211/71 

CTG AGG GGC AGT CGC CTC GGA GCC GTG AGC TAT GAG ACC GAC CGC AAC CAC GAC CTG GCG 
leu arg gly ser arg leu gly ala val ser tyr glu thr asp arg asn his asp leu ala 
241/81 271/91 

CCG CGC CAG ATC GCG CGG TAC CGC ACC GAC AAC GGC GAG GAG TTC GAA GTC CCG TTC GCC 
pro arg gin ile ala arg tyr arg thr asp asn gly glu glu phe glu val pro phe ala 
301/101 331/111 

GAT GAC GCC GAG ATC CCC GGC ACC TGG TTG TGC CGC AAC GGC ATG GAA GGC ACC CTG ATC 
asp asp ala glu ile pro gly thr trp leu cys arg asn gly met glu gly thr leu ile 
361/121 391/131 

GAG GGC GAC CTG CCC GAG CCG AAG AAG GTT AAG CCG CCC CGG ACG CAC TGG GAC ATG CTG 
glu gly asp leu pro glu pro lys lys val lys pro pro arg thr his tro aso met leu 
421/141 451/151 

CTG GAG CGC CGT TCC ATC GAA GAA CTC GAA GAG TTA CTT AAG GAG CGC CTC GAG CTC ATT 
leu glu arg arg ser ile glu glu leu glu glu leu leu lys glu arg leu glu leu ile 
481/161 

CGG TCA CGT CGG CGC GGC TGA 
arg ser arg arg arg gly OPA 



SEQ ID N° 4M 



FIGURE 4M 



SEQ ID N° 4N 
FEUILLE DE REMPIg^GgHgNJ (REGLE 26) 



WO 99/09186 




GAT CGC 


GGT 


CAA 


CGA 


GGC CGA 


asp arg 


gly 


gin arg 


gly arg 


61/21 








TGG CTA 


CGC 


CGC 


GGC 


GAC GGC 


trp leu 


arg 


arg 


gly 


asp gly 


121/41 








GGA GAT 


GAC 


CAG 


CGC 


GGG TGG 


gly asp 


asp 


gin 


arg 


gly trp 


181/61 








CAC CGC 


CGC 


GGC 


GAA 


CCA GTT 


his arg 


arg 


gly glu 


pro val 


241/81 








GCC CAC 


GCA 


GGG 


CAC 


CAC GCC 


ala his 


ala 


gly his 


his ala 


301/101 










GCA TCG 


GTC 


GCC 


GAT 




ala ser 


val 


ala 


asp 




ATC GCG 


GTC 


AAC 


GAG 


GCC GAA 


ile ala 


val 


asn 


glu 


ala glu 


62/21 








GGC TAC 


GCC 


GCG 


GCG 


ACG GCG 


gly tyr 


ala 


ala 


ala 


thr ala 


122/41 










GAG ATG 


ACC 


AGC 


GCG 


GGT GGG 


glu met 


thr 


ser 


ala 


gly gly 


182/61 








ACC GCC 


GCG 


GCG 


AAC 


CAG TTG 


thr ala 


ala 


ala 


asn 


gin leu 


242/81 








CCC ACG 


CAG 


GGC 


ACC 


ACG CCT 


pro thr 


gin 


gly thr 


thr pro 


302/101 








CAT CGG 


TCG 


CCG 


ATC 




his arg 


ser 


pro 


ile 





13/185 



31/11 

ATA CGG CGA GAT GTG GGC 
ile arg arg asp val gly 
91/31 

GAC GGC GAC GGC GAC GTT 
asp gly asp gly asp val 

151/51 
GCT CCT CGA GCA GGC CGC 
ala pro arg ala gly arg 

211/71 
GAT GAA CAA TGT GCC CCA 
asp glu gin cys ala pro 

271/91 
TTC TTC CAA GCT GGG TGG 
phe phe gin ala gly trp 



SEQ ID N° SA 
FIGURE 5A 









32/11 




TAC 


GGC 


GAG 


ATG TGG 


GCC 


tyr 


gly 


glu 


met trp 


ala 








92/31 




ACG 


GCG 


ACG 


GCG ACG 


TTG 


thr 


ala 


thr 


ala thr 


leu 








152/51 




CTC 


CTC 


GAG 


CAG GCC 


GCC 


leu 


leu 


glu 


gin ala 


ala 








212/71 




ATG 


AAC 


AAT 


GTG CCC 


CAG 


met 


asn 


asn 


val pro 


gin 








272/91 


TCT 


TCC 


AAG 


CTG GGT 


GGC 


ser 


ser 


lys 


leu gly 


gly 



SEQ ID N° 5B 
FIGURE 5B 



it 



CCA AGA CGC 
pro arg arg 


CGC 
arg 


CGC 
arg 


GAT 
asp 


GTT 
val 


GCT GCC GTT 
ala ala val 


CGA 
arg 


GGA 
gly 


GGC 
gly 


GCC 
ala 


CGC GGT CGA 
arg gly arg 


GGA 
gly 


GGC 
gly 


CTC 
leu 


CGA 
arg 


GGC GCT GCA 
gly ala ala 


ACA 
thr 


GCT 
ala 


GGC 
gly 


CCA 
pro 


CCT GTG GAA 
pro val glu 


GAC 
asp 


GGT 
gly 


CTC 
leu 


GCC 
ala 


CAA GAC GCC 
gin asp ala 


GCC 
ala 


GCG 
ala 


ATG 
met 


TTT 
phe 


CTG CCG TTC 
leu pro phe 


GAG 
glu 


GAG 

glu 


GCG 
ala 


CCG 
pro 


GCG GTC GAG 
ala val glu 


GAG 
glu 


GCC 
ala 


TCC 
ser 


GAC 
asp 


GCG CTG CAA 
ala leu gin 


CAG 
gin 


CTG 
leu 


GCC 
ala 


CAG 
gin 


CTG TGG AAG 
leu trp lys 


ACG 
thr 


GTC 
val 


TCG 
ser 


CCG 
pro 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 




T/FR98/01813 



14/185 



TCG CGG 


TCA 


ACG 


AGG 


CCG 


ser arg 


ser 


thr 


arg 


pro 


63/21 










GCT ACG 


CCG 


CGG 


CGA CGG 


ala thr 


pro 


arg 


arg 


arg 


123/41 








AGA TGA 


CCA 


GCG 


CGG 


GTG 


arg OPA 


pro 


ala 


arg 


val 


183/61 








CCG CCG 


CGG 


CGA 


ACC 


AGT 


pro pro 


arg 


arg 


thr 


ser 


243/81 










CCA CGC 


AGG 


GCA 


CCA 


CGC 


pro arg 


arg 


ala 


pro 


arg 


303/101 








ATC GGT 


CGC 


CGA 


TC 




ile gly 


arg 


arg 













33/11 


AAT ACG 


GCG 


AGA 


TGT GGG CCC 


asn thr 


ala 


arg 


cys gly pro 








93/31 


CGA CGG 


CGA 


CGG 


CGA CGT TGC 


arg arg 


arg 


arg 


arg arg cys 








153/51 


GGC TCC 


TCG 


AGC 


AGG CCG CCG 


gly ser 


ser 


ser 


arg pro pro 








213/71 


TGA TGA ACA 


ATG 


TGC CCC AGG 


OPA OPA 


thr 


met 


cys pro arg 








273/91 


CTT CTT 


CCA 


AGC 


TGG GTG GCC 


leu leu 


pro 


ser 


trp val ala 



SEQ ID N° 5C 
FIGURE 5C 



AAG ACG CCG 


CCG 


CGA 


TGT 


TTG 


lys thr pro 


pro 


arg 


cys 


leu 


TGC CGT TCG 


AGG 


AGG 


CGC 


CGG 


cys arg ser 


arg 


arg 


arg 


arg 


CGG TCG AGG 


AGG 


CCT 


CCG 


ACA 


arg ser arg 


arg 


pro 


pro 


thr 


CGC TGC AAC 


AGC 


TGG 


CCC 


AGC 


arg cys asn 


ser 


trp 


pro 


ser 


TGT GGA AGA 


CGG 


TCT 


CGC 


CGC 


cys gly arg 


arg 


ser 


arg 


arg 



partie de la sequence nucleotidique Seq 5A 
1/1 



61/21 
GAC CAG 
asp glr 
121/41 
CGC GGC 
arg gly 
181/61 



241/81 
GTC GCC GAT C 
val ala asp 

















31/11 












GAC 


GGC 


GAC 


GGC 


GAC 


GGC 


GAC 


GTT GCT GCC 


GTT CGA GGA 


GGC 


GCC 


GGA 


GAT 


asp 


gly 


asp 


gly 


asp 


gly 


asp 


val ala ala 


val arg gly 


gly 


ala 


gly 


asp 
















91/31 








GGG 


TGG 


GCT 


CCT 


CGA 


GCA 


GGC 


CGC CGC GGT 


CGA GGA GGC 


CTC 


CGA 


CAC 


CGC 


gly 


trp 


ala 


pro 


arg 


ala 


gly 


arg arg gly 
151/51 


arg gly gly 


leu 


arg 


his 


arg 


CCA 


GTT 


GAT 


GAA 


CAA 


TGT 


GCC 


CCA GGC GCT 


GCA ACA GCT 


GGC 


CCA 


GCC 


CAC 


pro 


val 


asp 


glu 


gin 


cys 


ala 


pro gly ala 


ala thr ala 


gly 


pro 


ala 


his 
















271/71 








CAC 


GCC 


TTC 


TTC 


CAA 


GCT 


GGG 


TGG CCT GTG 


GAA GAC GGT 


CTC 


GCC 


GCA 


TCG 


his 


ala 


phe 


phe 


gin 


ala 


gly 


trp pro val 


glu asp gly 


leu 


ala 


ala 


ser 



SEQ ID N° 5A' 
FIGURE 5A' 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



15/185 



7FR98/01813 



1/1 31/U 

TAC GCC GCG GCG ACG GCG ACG GCG ACG GCG ACG TTG CTG CCG TTC GAG GAG GCG CCG GAG 
tyr ala ala ala thr ala thr ala thr ala thr leu leu pro phe glu glu a l a pro glu 
61/21 91 / 31 

ATG ACC AGC GCG GGT GGG CTC CTC GAG CAG GCC GCC GCG GTC GAG GAG GCC TCC GAC ACC 
met thr ser ala gly gly leu leu glu gin ala ala ala val glu glu ala ser asp thr 
121/41 151/51 

GCC GCG GCG AAC CAG TTG ATG AAC AAT GTG CCC CAG GCG CTG CAA CAG CTG GCC CAG CCC 

™?/« a SSn 9ln leU met asn asn val pro 9 ln ala leu 9 ln gin 1^ ala gin pro 
181/61 211/71 

ACG CAG GGC ACC ACG CCT TCT TCC AAG CTG GGT GGC CTG TGG AAG ACG GTC TCG CCG CAT 

241/81° l6U tCP lyS thr Val Set pro his 

CGG TCG CCG ATC 
arg ser pro ile 



SEQ ID N° 5B' 
FIGURE 5B' 



1/1 • 31/U 

ACG CCG CGG CGA CGG CGA CGG CGA CGG CGA CGT TGC TGC CGT TCG AGG AGG CGC CGG AGA 
thrpro arg arg arg arg arg arg arg arg arg^cys cys arg ser arg arg arg arg arg 

TGA CCA GCG CGG GTG GGC TCC TCG AGC AGG CCG CCG CGG TCG AGG AGG CCT CCG ACA CCG 
CPA pro ala arg val gly ser ser ser arg pro pro arg ser arg arg pro pro thr pro 
i * A/ * A 151/51 

CCG CGG CGA ACC ACT TGA TGA ACA ATG TGC CCC AGG CGC TGC AAC AGC TGG CCC AGC CCA 
lllA? ° PA ° PA CyS HI " g atg CyS 3Sn sei tr P P« «r P rt 

CGC AGG GCA CCA CGC CTT CTT CCA AGC TGG GTG GCC TGT GGA AGA CGG TCT CGC CGC ATC 
Win? P " Pr ° S " tCP Val aU ° yS gly arg arg s « «g arg ile 

GGT CGC CGA TC 
gly arg arg 



SEQ ID N° 5C 
FIGURE 5C 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 




VFR98/01813 



16/185 



ORF predite par Cole et al. (Nature 393:537-544} et contenant seq5A' 
1/1 31/11 

tga act gat gat tct gat age gac caa cct ctt ggg gca aaa cac ccc ggc gat cgc ggt 
OPA thr asp asp ser asp ser asp gin pro leu gly ala lys his pro gly asp arg qlv 
61/21 91/31 

caa cga ggc cga ata egg cga gat gtg ggc cca aga cgc cgc cgc gat gtt. tgg eta cgc 
gin arg gly arg ile arg arg asp val gly pro arg arg arg arg asp val trp leu ara 
121/41 151/51 

cgc ggc gac ggc gac ggc gac ggc gac gtt get gee gtt cga gga ggc gee gga gat gac 
arg gly asp gly asp gly asp gly asp val ala ala val arg gly gly ala gly asp asp 
181/61 211/71 

cag cgc ggg tgg get cct cga gca ggc cgc cgc ggt cga gga ggc etc cga cac cgc cgc 
gin arg gly trp ala pro arg ala gly arg arg gly arg gly gly leu arg his arq arq 
241/81 271/91 

ggc gaa cca gtt gat gaa caa tgt gee cca ggc get gca aca get ggc cca gee cac gca 
gly glu pro val asp glu gin cys ala pro gly ala ala thr ala gly pro ala his ala 
301/101 331/111 

ggg cac cac gee ttc ttc caa get ggg tgg cct gtg gaa gac ggt etc gee gca teg gtc 
gly his his ala phe phe gin ala gly trp pro val glu asp gly leu ala ala ser val 
361/121 391/131 

gee gat cag caa cat ggt gtc gat ggc caa caa cca cat gtc gat gac caa etc ggg tgt 
ala asp gin gin his gly val asp gly gin gin pro his val asp asp gin leu qlv cvs 
421/141 451/151 

gtc gat gac caa cac ctt gag etc gat gtt gaa ggg ctt tgc tec ggc ggc ggc cgc cca 
val asp asp gin his leu glu leu asp val glu gly leu cys ser gly gly gly arg pro 
481/161 511/171 

ggc cgt gca aac cgc ggc gca aaa egg ggt ccg ggc gat gag etc get ggg cag etc get 
gly arg ala asn arg gly ala lys arg gly pro gly asp glu leu ala gly gin leu ala 
541/181 571/191 

ggg ttc ttc ggg tct ggg egg tgg ggt ggc cgc caa ctt ggg teg ggc ggc etc ggt egg 
gly phe phe gly ser gly arg trp gly gly arg gin leu gly ser gly gly leu gly arg 
601/201 631/211 

ttc gtt gtc .ggt gec gca ggc ctg ggc cgc ggc caa cca ggc agt cac ccc ggc ggc gcg 
phe val val gly ala ala gly leu gly arg gly gin pro gly ser his pro gly gly ala 
661/221 691/231 

ggc get gee get gac cag cct gac cag cgc cgc gga aag agg gec egg gca gat get ggg 
gly ala ala ala asp gin pro asp gin arg arg gly lys arg ala arg ala asp ala qly 
721/241 751/251 

egg get gee ggt ggg gca gat ggg cgc cag ggc egg tgg tgg get cag tgg tgt get gcg 
arg ala ala gly gly ala asp gly arg gin gly arg trp trp ala gin trp cys ala ala 
781/261 811/271 

tgt tec gec gcg acc eta tgt gat gec gca ttc tec ggc ggc egg eta gga gag ggg gcg 
cys ser ala ala thr leu cys asp ala ala phe ser gly gly arg leu gly glu gly ala 
841/281 

cag act gtc gtt att tga 
gin thr val val ile OPA 



SEQ ID N° 5F 



FIGURE 5F 



FEUILLE DE REMPLACEMENT (REGLE 26) 




WO 99/09186 ^CT/FR98/01813 

17/185 

sequence Rvll96 predite par Cole et al. (Nature 393:537-544) et pouvant coder pour line 
ORF en fusion avec Seq5A' 

1/1 31/11 

atg gtg gat ttc ggg gcg tta cca ccg gag ate aac tec gcg agg atg tac gec ggc ccg 
Met val asp phe gly ala leu pro pro glu ile asn ser ala arg met tyr ala gly pro 
61/21 91/31 

ggt teg gec teg ctg gtg gec gcg get cag atg tgg gac age gtg gcg agt gac ctg ttt 
gly ser ala ser leu val ala ala ala gin met trp asp ser val ala ser asp leu phe 
121/41 151/51 

teg gec gcg teg gcg ttt cag teg gtg gtc tgg ggt ctg acg gtg ggg teg tgg ata ggt 

181 61 d ^ a ^ ^ Val gly Ser trp ile gly 

teg teg gcg ggt ctg atg gtg gcg gcg gee teg ccg tat gtg gcg tgg atg age gtc ace 
ser ser ala gly leu met val ala " 
ala ala ser pro tyr val ala trp met ser val thr 
241/81 271/91 

gcg ggg cag gec gag ctg acc gee gee cag gtc egg gtt get gcg gcg gec tac gag acg 
ala gly gin ala glu leu thr ala ala gin val arg val ala ala ala ala tyr glu thr 
301/101 331/111 

gcg tat ggg ctg acg gtg ccc ccg ccg gtg ate gee gag aac cgt get gaa ctg atg att 
ala tyr gly leu thr val pro pro pro val ile ala glu asn arg ala glu leu met ile 
361/121 391/131 

ctg ata gcg acc aac etc ttg ggg caa aac acc ccg gcg ate gcg gtc aac gag gec gaa 
leu ile ala thr asn leu leu gly gin asn thr pro ala ile ala val asn glu ala glu 
421/141 451/151 

tac ggc gag atg tgg gec caa gac gee gee gcg atg ttt ggc tac gee gcg gcg acg gcg 
tyr gly glu met trp ala gin asp ala ala ala met phe gly tyr ala ala ala thr ala 
481/161 511/171 

acg gcg acg gcg acg ttg ctg ccg ttc gag gag gcg ccg gag atg acc age gcg ggt ggg 
thr ala thr ala thr leu leu pro phe glu glu ala pro glu met thr ser ala gly gly 
541/181 571/191 

etc etc gag cag gec gec gcg gtc gag gag gec tec gac acc gec gcg gcg aac cag ttg 
leu leu glu gin ala ala ala val glu glu ala ser asp thr ala ala ala asn gin leu 
601/201 631/211 

atg aac aat gtg ccc cag gcg ctg caa cag ctg gee cag ccc acg cag ggc acc acg cct 
met asn asn val pro gin ala leu gin gin leu ala gin pro thr gin gly thr thr pro 
661/221 691/231 

tct tec aag ctg ggt ggc ctg tgg aag acg gtc teg ccg cat egg teg ccg ate age aac 
ser ser lys leu gly gly leu trp lys thr val ser pro his arg ser pro ile ser asn 
721/241 751/251 

atg gtg teg atg gec aac aac cac atg teg atg acc aac teg ggt gtg teg atg acc aac 
met val ser met ala asn asn his met ser met thr asn ser gly val ser met thr asn 
781/261 811/271 

acc ttg age teg atg ttg aag ggc ttt get ccg gcg gcg gec gec cag gee gtg caa acc 
thr leu ser ser met leu lys gly phe ala pro ala ala ala ala gin ala val gin thr 
841/281 871/291 

gcg gcg caa aac ggg gtc egg gcg atg age teg ctg ggc age teg ctg ggt tct teg ggt 
ala ala gin asn gly val arg ala met ser ser leu gly ser ser leu gly ser ser alv 
901/301 931/311 

ctg ggc ggt ggg gtg gec gee aac ttg ggt egg gcg gec teg gtc ggt teg ttg teg gtg 
leu gly gly gly val ala ala asn leu gly arg ala ala ser val gly ser leu ser val 
961/321 991/331 

gtc acc c 
val thr p 
1051/351 
ccc ggg c 
pro gly g 
1111/371 
etc agt g 
leu ser g 
1171/391 



SEQ ID N° 5R 



ccg cag gee 


tgg 


gec 


gcg 


gee 


aac 


cag 


pro gin ala 


trp 


ala 


ala 


ala 


asn 


gin 


1021/341 












acc age ctg 


acc 


age 


gee 


gcg 


gaa 


aga 


thr ser leu 


thr 


ser 


ala 


ala 


glu 


arg 


1081/361 










ggg cag atg 


ggc 


gee 


agg 


gec 


ggt 


ggt 


gly gin met 


gly 


ala 


arg 


ala 


gly 


gly 


1141/381 










ccc tat gtg 


atg 


ccg 


cat 


tct 


ccg 


gcg 


pro tyr val 


met 


pro 


his 


ser 


pro 


ala 



gcg 


gcg 


egg 


gcg 


ctg 


ccg 


ctg 


ala 


ala 


arg 


ala 


leu 


pro 


leu 


atg 


ctg 


ggc 


ggg 


ctg 


ccg 


gtg 


met 


leu 


gly 


gly 


leu 


pro 


val 


gtg 


ctg 


cgt 


gtt 


ccg 


ccg 


cga 


val 


leu 


arg 


val 


pro 


pro 


arg 



FIGURE 5R 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 '^^T/FR98/01813 



18/185 



beq or. 


UKt 


d' apres 


Cole et al. {Nature 


1/1 












tag gga 


cac 


gta 


atg 


gtg 


gat ttc ggg gcg 




hi <t 


val 


met 


val 


asp phe gly ala 


61/21 










tac gcc 


ggc 


ccg 


ggt 


teg 


gcc teg ctg gtg 


tyr ala 


gly 


pro 


gly 


ser 


ala ser leu val 














agt gac 


ctg 


ttt 


teg 


gcc 


gcg teg gcg ttt 


ser asp 


leu 


phe 


ser 


ala 


ala ser ala phe 


1 ft! /£1 
101/ ox 










teg tgg 


at a 


ggt 


teg 


teg 


gcg ggt ctg atg 


3SE* trp 




gly 


ser 


ser 


ala gly leu met 


941 /ftl 
tSl/ol 










atg age 


gtc 


ace 


gcg 


ggg 


cag gcc gag ctg 


net sex* 


VaX 


thr 


ala 


gly 


gin ala glu leu 


ini /mi 












gcc tac 


gag 


acg 


gcg 


tat 


ggg ctg acg gtg 


ala tyr 


glu 


thr 


ala 


tyr 


gly leu thr val 


361/121 












gaa ctg 


dug 


att 


ctg 


at a 


gcg acc aac etc 




met 


ile 


leu 


ile 


ala thr asn leu 


421/141 












a a <ra 

daw y<*y 


gcc 


gaa 


tac 


ggc 


gag atg tgg gcc 


asn glu 


ala 


glu 


tyr 


gly 


glu met trp ala 


481/161 








gcg gcg 


acg 


gcg 


acg 


gcg 


acg gcg acg ttg 


ala ala 




ala 


thr 


ala 


thr ala thr leu 


541/181 












age gcg 


ggt 


ggg 


etc 


etc 


gag cag gcc gcc 


ser ala 


gxy 


gly 


leu 


leu 


glu gin ala ala 


601/201 










gcg aac 


cag 


ttg 


atg 


aac 


aat gtg ccc cag 


al a aqn 


gin 


leu 


met 


asn 


asn val pro gin 


661/221 












acg 


cct 


tct 


tec 


aag ctg ggt ggc 


gly thr 




pro 


ser 


ser 


lys leu gly gly 


721/241 










ffrt at*r^ 


age 


aac 


atg 


gtg 


teg atg gcc aac 


pro ile 


ser 


asn 


met 


val 


ser met ala asn 


781/261 












teg atg 


acc 


aac 


acc 


ttg 


age teg atg ttg 


ser met 


thr 


asn 


thr 


leu 


ser ser met leu 


841/281 












gcc gtg 


caa 


acc 


gcg 


gcg 


caa aac ggg gtc 


ala val 


gin 


thr 


ala 


ala 


gin asn gly val 


901/301 










ggt tct 


teg 


ggt 


ctg 


ggc 


ggt ggg gtg gcc 


gly ser 


ser 


gly 


leu 


gly 


gly gly val ala 


961/321 










teg ttg 


teg 


gtg 


ccg 


cag 


gcc tgg gcc gcg 


ser leu 


ser 


val 


pro 


gin 


ala trp ala ala 


1021/341 






gcg ctg ccg 


ctg 


acc 


age 


ctg acc age gcc 


ala leu 


pro 


leu 


thr 


ser 


leu thr ser ala 


1081/361 1111/371 






ggg ctg 


ccg 


gtg 


ggg 


cag 


atg ggc gcc agg 


gly leu pro val gly 


gin 


met gly ala arg 


1141/381 








gtt ccg 


ccg 


cga 


ccc 


tat 


gtg atg ccg cat 


val pro 


pro 


arg 


pro 


tyr 


val met pro his 



393:537- 


•544) 


et 


contenant la sequence I* 


31/11 


















tta cca 
leu pro 
91/31 


ccg 
pro 


gag 
glu 


ate 
ile 


aac 
asn 


tec 
ser 


gcg 
ala 


agg 
arg 


atg 
met 


gcc gcg 
ala ala 
151/51 


get 
ala 


cag 
gin 


atg 
met 


tgg 
trp 


gac 
asp 


age 
ser 


gtg 

val 


gcg 
ala 


cag teg 
gin ser 
211/71 


gtg 
val 


gtc 
val 


tgg 
trp 


ggt 
gly 


ctg 
leu 


acg 
thr 


gtg 

val 


ggg 
gly 


gtg gcg 
val ala 
271/91 


gcg 
ala 


gcc 
ala 


teg 
ser 


ccg 
pro 


tat 
tyr 


gtg 
val 


gcg 
ala 


tgg 
trp 


acc gcc 
thr ala 
331/111 


gcc 
ala 


cag 
gin 


gtc 
val 


egg 
arg 


gtt 
val 


get 
ala 


gcg 
ala 


gcg 
ala 


ccc ccg 
pro pro 
391/131 


ccg 
pro 


gtg 
val 


ate 
ile 


gcc 
ala 


gag 
glu 


aac 
asn 


cgt 
arg 


get 
ala 


ttg ggg 
leu gly 
451/151 


caa 
gin 


aac 
asn 


acc 
thr 


ccg 
pro 


gcg 
ala 


ate 
ile 


gcg 
ala 


gtc 
val 


caa gac 
gin asp 
511/171 


gcc 
ala 


gcc 
ala 


gcg 
ala 


atg 
met 


ttt 
phe 


ggc 
gly 


tac 
tyr 


gcc 
ala 


ctg ccg 
leu pro 
571/191 


ttc 
pne 


gag 
glu 


gag 
glu 


gcg 

ala 


ccg 
pro 


gag 
glu 


atg 
met 


acc 
thr 


gcg gtc 
ala val 
631/211 


gag 
gxu 


gag 
glu 


gcc 
ala 


tec 
ser 


gac 
asp 


acc 
thr 


gcc 
ala 


gcg 
ala 


gcg ctg 
ala leu 
691/231 


caa 
gin 


cag 
gin 


ctg 
leu 


gcc 
ala 


cag 
gin 


ccc 
pro 


acg 
thr 


cag 
gin 


ctg tgg 
leu trp 
751/251 


aag 
iys 


acg 
thr 


gtc 
val 


teg 
3er 


ccg 
pro 


cat 
his 


egg 
arg 


teg 
ser 


aac cac 
asn his 
811/271 


atg 
met 


teg 
ser 


atg 
met 


acc 
thr 


aac 
asn 


teg 
ser 


ggt 
gly 


gtg 
val 


aag ggc 
lys gly 
871/291 


ttt 
phe 


get 
ala 


ccg 
pro 


gcg 
ala 


gcg 
ala 


gcc 
ala 


gcc 
ala 


cag 
gin 


egg gcg 
arg ala 
931/311 


atg 
met 


age 
ser 


teg 
ser 


ctg 
leu 


ggc 
gly 


age 
ser 


teg 
ser 


ctg 
leu 


gcc aac 
ala asn 
991/331 


ttg 
leu 


gly 


egg 
arg 


gcg 
ala 


gcc 
ala 


teg 
3er 


gtc 
val 


ggt 
gly 


gcc aac cag 
ala asn gin 
1051/351 


gea 
ala 


gtc 
val 


acc 
thr 


ccg 
pro 


gcg 
ala 


gcg 

ala 


egg 
arg 


gcg gaa aga 
ala glu arg 


ggg 

gly 


ccc 
pro 


ggg 

gly 


cag 
gin 


atg 
met 


ctg 
leu 


ggc 

giy 


gcc ggt ggt 
ala gly gly 
1171/391 


ggg 

gly 


etc 
leu 


agt 
ser 


ggt 
gly 


gtg 
val 


ctg 
leu 


cgt 
arg 


tct ccg 
ser pro 


gcg 
ala 


gcc 
ala 


ggc 
gly 


tag 
AM 8 











SEQ ID N" 5P 



FEUILLE DE REM#i2£$llSE&? (REGLE 26) 



WO 99/09186 ^^IYFR98/01813 

19/185 

31/11 

GGA TCC TGA TGC AAG TGG TCC GGG ATT TGT CGG CAG CCA CCG CGG TCC CGT CGA CCA ACG 
gly ser OPA cys lys trp ser gly ile cys arg gin pro arg arg ser arg arg pro thr 
61/21 91/31 

TTG GTG CAT CCG GGC TGC GAG CAT GCA CGC ACC GAC CAG CGC GGC GAG CGC GGC TAG CTG 
leu val his pro gly cya glu his ala arg thr asp gin arg gly glu arg gly AMB leu 
121/41 151/51 

CTT GCC CAC TGT TCC TCC CTG CCG GCA CCA TGT GCG ACA AGC TTA AGC GCA GCA GTA CCG 
leu ala his cys ser ser leu pro ala pro cys ala thr ser leu ser ala ala val oro 
181/61 211/71 

GCG GTG CCT GGG CAT CCA GCA AAA CGG GGA GCT CAA GAA CGA TTC ATG AAC GAG GGG TCG 
ala val pro gly his pro ala lys arg gly ala gin glu arg phe met asn glu gly sec 
241/81 271/91 

TCA CCA ACG TCG AAA CCG ACG GTT GCC AGC CGG CCC ACG ATA TTG CGT GCT CGA GGG TCC 
ser pro thr ser lys pro thr val ala ser arg pro thr ile leu arg ala arg gly ser 
301/101 331/111 

GCT GTA CCC TCA CCG AAC GTG AGT CCC ACA CCG CGG AGG CGG GCG ACT CTG GCG TCG TTA 
ala val pro ser pro asn val ser pro thr pro arg arg arg ala thr leu ala ser leu 
361/121 391/131 

GCA GCC GAG CTC AAG GTG TCC CGC ACC ACT GTC TCG AAT GCT TTT AAC CGA CCG GAT CCA 
ala ala glu leu lys val ser arg thr thr val ser asn ala phe asn arg pro asp oro 
421/141 y H H ' 

GAA GGA GAA GAT C 
glu gly glu asp 

SEQ ID N° 6A 
FIGURE 6A 



GAT CCT 


GAT 


GCA 


AGT 


asp pro 


asp 


ala 


ser 


62/21 








TGG TGC 


ATC 


CGG 


GCT 


trp cys 


ile 


arg 


ala 


122/41 








TTG CCC 


ACT 


GTT 


CCT 


leu pro 


thr 


val 


pro 


182/61 






CGG TGC 


CTG 


GGC 


ATC 


arg cys 


leu 


gly 


ile 


242/81 








CAC CAA 


CGT 


CGA 


AAC 


his gin 


arg 


arg 


asn 


302/101 








CTG TAC 


CCT 


CAC 


CGA 


leu tyr 


pro 


his 


arg 


362/121 






CAG CCG 


AGC 


TCA 


AGG 


gin pro 


ser 


ser 


arg 


422/141 








AAG GAG 


AAG 


ATC 




lys glu 


lys 


ile 





GGT CCG GGA TTT GTC 
gly pro gly phe val 

GCG AGC ATG CAC GCA 
ala ser met his ala 

CCC TGC CGG CAC CAT 
pro cys arg his his 

CAG CAA AAC GGG GAG 
gin gin asn gly glu 

CGA CGG TTG CCA GCC 
arg arg leu pro ala 

ACG TGA GTC CCA CAC 
thr OPA val pro his 

TGT CCC GCA CCA CTG 
cys pro ala pro leu 



32/11 

GGC AGC CAC GGC GGT 
gly ser his gly gly 
92/31 

CCG ACC AGC GCG GCG 
pro thr ser ala ala 
152/51 

GTG CGA CAA GCT TAA 
val arg gin ala OCH 
212/71 

CTC AAG AAC GAT TCA 
leu lys asn asp ser 
272/91 

GGC CCA CGA TAT TGC 
gly pro arg tyr cys 
332/111 

CGC GGA GGC GGG CGA 
arg gly gly gly arg 
392/131 

TCT CGA ATG CTT TTA 
ser arg met leu leu 



CCC 


GTC 


GAC 


CAA 


CGT 


pro 


val 


asp 


gin 


arg 


AGC 


GCG 


GCT 


AGC 


TGC 


ser 


ala 


ala 


ser 


cys 


GCG 


CAG 


CAG 


TAC 


CGG 


ala 


gin 


gin 


tyr 


arg 


TGA 


ACG 


AGG 


GGT 


CGT 


OPA 


thr 


arg 


gly 


arg 


GTG 


CTC 


GAG 


GGT 


CCG 


val 


leu 


glu 


gly 


pro 


CTC 


TGG 


CGT 


CGT 


TAG 


leu 


trp 


arg 


arg 


AMB 


ACC 


GAC 


CGG 


ATC 


CAG 


thr 


asp 


arg 


ile 


gin 



SEQ ID N° 6B 



FEUILLE DE REMpliSSfelfP (REGLE 26) 



WO 99/09186 




ATC CTG 


ATG 


CAA GTG 


GTC 


CGG 


ile leu 


met 


gin val 


val 


arg 


63/21 








GGT GCA 


TCC 


GGG CTG 


CGA 


GCA 


gly ala 


ser 


crlv leu 


arg 


ala 


123/41 








TGC CCA 


CTG 


TTC CTC 


CCT 


GCC 


cys pro 


leu 


phe leu 


pro 


ala 


183/61 








GGT GCC 


TGG 


GCA TCC 


AGC 


AAA 


gly ala 


trp 


ala ser 


ser lys 


243/81 










ACC AAC 


GTC 


GAA ACC 


GAC 


GGT 


thr asn 


val 


glu thr 


asp gly 


303/101 










TGT ACC 


CTC 


ACC GAA 


CGT 


GAG 


cys thr 


leu 


thr glu 


arg glu 


363/121 










AGC CGA 


GCT 


CAA GGT 


GTC 


CCG 


ser arg 


ala 


gin gly 


val 


pro 


423/141 










AGG AGA 


AGA 


TC 






arg arg 


arg 









CCG TCG 


GCA 


ACT 


TGG 


CCG 


CTG 


pro ser 


ala 


thr 


trp 


pro 


leu 


61/21 












AGC GGC 


TCC 


ATC 


GGC 


TTT 


GCT 


ser gly 


ser 


ile 


gly 


phe ala 


121/41 










TGG CCG 


GTG 


ATA 


TAT 


TCG 


GTC 


trp pro 


val 


ile 


tyr 


trp 


val 


181/61 












CGC CGC 


GGT 


GCT 


CGA 


GCC 


AGG 


arg arg 


gly 


ala 


arg 


ala 


arg 


241/81 










CTT GTA 


TCT 


CTT 


CTC 


CGT 


GCC 


leu val 


ser 


leu 


leu 


arg 


ala 


301/101 










AGG TTC 


ACC 


AGG 


TCT 


CAC 


CAG 


arg phe 


thr 


arg 


ser 


his 


gin 



20/185 









33/11 




GAT 


TTG 


TCG 


GCA GCC 


ACG 


asp 


leu 


ser 


A 1 A A 1 A 
axa ui.a 


thr 












TGC 


ACG 


CAC 


CGA CCA 


GCG 


cys 


thr 


his 


arg pro 


aid 








153/51 




GGC 


ACC 


ATG 


TGC GAC 


AAG 


gly thr 


met 


cys asp 


lys 








213/71 




ACG 


GGG 


AGC 


TCA AGA 


ACG 


thr gly 


ser 


ser arg 


thr 








273/91 




TGC 


CAG 


CCG 


GCC CAC 


GAT 


cys 


gin pro 


ala his 


asp 








333/111 




TCC 


CAC 


ACC 


GCG GAG 


GCG 


ser 


his 


thr 


ala glu 


ala 








393/131 




CAC 


CAC 


TGT 


CTC GAA 


TGC 


his 


his 


cys 


leu glu 


cys 



SEQ ID N° 6C 
FIGURE 6C 









31/11 




AGG 


TCG 


GCT 


TGA TCC 


CTG 


arg 


ser 


ala 


OPA ser 


leu 








91/31 




GGT 


AGC 


GGT 


TCG GCG 


GGA 


gly ser 


gly 


ser ala 


gly 








151/51 




AGA 


CGG 


GTA 


TGG CGG 


CGG 


arg 


arg 


val 


trp arg 


arg 








211/71 




CTT 


ACG 


ACC 


AGG GAA 


TTT 


leu 


thr 


thr 


arg glu 


phe 








271/91 


ACC 


CCC 


TAG 


GTG TAG 


TGT 


thr 


pro 


AMB 


val AMB 


cys 



ATC 
ile 



^CT/FR98/01813 



GCG 
ala 


GTC 
val 


CCG 
pro 


TCG 
ser 


ACC 
thr 


AAC 
asn 


GTT 
val 


CGG 
arg 


CGA 
arg 


GCG 
ala 


CGG 
arg 


CTA 
leu 


GCT 
ala 


GCT 
ala 


CTT AAG 
leu lys 


CGC 
arg 


AGC 
scr 


AGT 
ser 


ACC 
thr 


GGC 
gly 


ATT 
ile 


CAT 
his 


GAA 
glu 


CGA 
arg 


GGG 
gly 


GTC 
val 


GTC 
val 


ATT GCG TGC TCG AGG GTC CGC 
ile ala cys ser arg val ar< 


GGC 
gly 


GAC 
asp 


TCT 
ser 


GGC 
gly 


GTC 
val 


GTT 
val 


AGC 
ser 


TTT 
phe 


TAA 
OCH 


CCG 
pro 


ACC 
thr 


GGA 
gly 


TCC 
ser 


AGA 
arg 


GGC 
gly 


CGA 
arg 


GGC 
gly 


GGG 
gly 


TCA 
ser 


GCC 
ala 


AAT 
asn 


AGC 
ser 


TAG 
AMB 


CGG 
arg 


CGA 
arg 


CGT 
arg 


TGT 
cys 


CGG 
arg 


CTG 
leu 


AGG 
arg 


TGA 
OPA 


TCT 
ser 


GCG 
ala 


ACA 
thr 


CGC 
arg 


CGA 
arg 


AAA 

lys 


TGT 
cys 


TAT 
tyr 


TCA 
ser 


GAA CAT 
glu his 


TTT 
phe 


CGA 
arg 


GTA 
val 


CCG 
pro 


GCA 
ala 


GAT 
asp 


CCC 
pro 



SEQ ID N° 7A 
FIGURE 7A 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/0918* 



7FR98/01813 



21/185 



CGT CGG 


CAA 


CTT 


GGC 


CGC 


TGA 


arg arg 


gin 


leu 


gly 


arg 


OPA 


62/21 












GCG GCT 


CCA 


TCG 


GCT 


TTG 


CTG 


ala ala 


pro 


ser 


ala 


leu 


leu 


122/41 












GGC CGG 


TGA 


TAT 


ATT 


GGG 


TCA 


gly arg 


OPA 


tyr 


ile 


gly 


ser 


182/61 










GCC GCG 


GTG 


CTC 


GAG 


CCA 


GGC 


ala ala 


val 


leu 


glu 


pro 


gly 


242/81 










TTG TAT 


CTC 


TTC 


TCC 


GTG 


CCA 


leu tyr 


leu 


phe 


ser 


val 


pro 


302/101 










GGT TCA 


CCA 


GGT 


CTC 


ACC 


AGA 


gly ser 


pro 


gly leu 


thr 


arg 









32/11 


GGT 


CGG 


CTT 


GAT CCC TGG 


gly 


arg 


leu 


aSD Dro trn 








92/31 


GTA 


GCG 


GTT 


CGG CGG GAA 


val 


ala 


val 


arg arg glu 








152/51 


GAC 


GGG 


TAT 


GGC GGC GGC 


asp 


gly tyr 


gly gly gly 








212/71 


TTA 


CGA 


CCA 


GGG AAT TTC 


leu 


arg 


pro 


gly asn phe 








272/91 


CCC 


CCT 


AGG 


TGT AGT GTT 


pro 


pro 


arg 


cys ser val 


TC 









SEQ ID N° 7B 
FIGURE 7B 



GCC GAG GCG GGT CAG CCA ATA 
ala glu ala gly gin pro ile 

GCT AGC GGC GAC GTT GTC GGT 
ala ser gly asp val val gly 

TGA GGT GAT CTG CGA CAC GCC 
OPA gly asp leu arg his ala 

GAA AAT GTT ATT CAG AAC ATC 
glu asn val ile gin asn ile 

TTC GAG TAC CGG CAG ATC CCA 
phe glu tyr arg gin ile pro 



GTC GGC 


AAC 


TTG 


GCC 


GCT GAG 


val gly 


asn 


leu 


ala 


ala glu 


63/21 








CGG CTC 


CAT 


CGG 


CTT 


TGC TGG 


arg leu 


his 


arg 


leu 


cys trp 


123/41 








GCC GGT 


GAT 


ATA 


TTG 


GGT CAG 


ala gly 


asp 


ile 


leu 


gly gin 


183/61 








CCG CGG 


TGC 


TCG 


AGC 


CAG GCT 


pro arg 


cys 


ser 


ser 


gin ala 


243/81 








TGT ATC 


TCT 


TCT 


CCG 


TGC CAC 


cys ile 


ser 


ser 


pro 


cys his 


303/101 








GTT CAC 


CAG 


GTC 


TCA 


CCA GAT 


val his 


gin 


val 


ser 


pro asp 









33/11 




GTC 


GGC 


TTG 


ATC CCT 


GGG 


val 


gly 


leu 


ile pro 


gly 








93/31 




TAG 


CGG 


TTC 


GGC GGG 


AAG 


AMB 


arg 


phe 


gly gly 


lys 








153/51 




ACG 


GGT 


ATG 


GCG GCG 


GCT 


thr 


gly 


met 


ala ala 


ala 








213/71 




TAC 


GAC 


CAG 


GGA ATT 


TCG 


tyr 


asp 


gin 


gly ile 


ser 








273/91 




CCC 


CTA 


GGT 


GTA GTG 


TTT 


pro 


leu 


gly 


val val 


phe 



C 



SEQ ID N° 7C 
FIGURE 7C 



CCG AGG CGG GTC AGC CAA TAG 
pro arq arg val ser gin AMB 

CTA GCG GCG ACG TTG TCG GTG 
leu ala ala thr leu ser val 

GAG GTG ATC TGC GAC ACG CCG 
glu val ile cys asp thr pro 

AAA ATG TTA TTC AGA ACA TCT 
lys met leu phe arg thr ser 

TCG AGT ACC GGC AGA TCC CAG 
ser ser thr gly arg ser gin 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 




CTT TGC 


GTG 


ATG 


TCC AAT 




val 

vol 


met 


ser 


asn 












TAG TTT 


TCG 


CGA 


TGA CGC 


AMR rvh*» 


ser 


arg 


ADR 


arg 


121/41 










AGC GAA 


CCG 


TCG 


ATT 


CCA 


ser giu 


pro 


ser 


ile 


pro 


101/ ox 










CGT TCC 


TGG 


GTT 


CGA 


CAC 


arg ser 


trp 


val 


arg 


his 


241/81 










GCG TCT 


TGG 


CTG 


CCG 


CCC 


ala ser 


trp 


leu 


pro 


pro 


301/101 










CGC GAA 


ACG 


TCA 


CCG 


CGT 


arg glu 


thr 


ser 


pro 


arg 


361/121 










ACG GTC 


GGG 


CGC 


CAT 


CGA 


thr val 


gly 


arg 


his 


arg 


421/141 










TCG GCG 


ACG 


ATC 






ser ala 


thr 


ile 






TTT GCG 


TGA 


TGT 


CCA 


ATG 


phe ala 


OPA 


cy s 


pro 


met 


62/21 










AGT TTT 


CGC 


GAT 


GAC 


GCT 


ser phe 


arg 




asp 


ala 


122/41 










GCG AAC 


CGT 


CGA 


TTC 


CAT 




a rrr 




phe his 


182/61 










GTT CCT 


GGG 


TTC 


GAC 


ACC 


val pro 


gly 


phe 


asp 


thr 


242/81 








CGT CTT 


GGC 


TGC 


CGC 


CCC 


arg leu 


gly 


cys 


arg 


pro 


302/101 










GCG AAA 


CGT 


CAC 


CGC 


GTT 


ala lys 


arg 


his 


arg 


val 


362/121 








CGG TCG 


GGC 


GCC 


ATC 


GAC 


arg ser 


gly 


ala 


ile 


asp 


422/141 








CGG CGA 


CGA 


TC 






arg arg 


arg 









22/185 









"51/11 




GGC 


GAA AAC 




GCC TTG 


TCA 


gly glu asn 


asp 


ala leu 


ser 








Q1 /■31 
91/ il 




TCG 


TTC TGA 


CCG 


GAC TTG 


TGA 


ser phe OPA 


pro 


dop IcU 


AHA 








1 / CI 




TGG 


GTG TCG 


ACVj 


W\l ICG 


TGG 


trp val ser 


thr 


his ser 


tip 








211/71 


CAT 


TCG CCC 


AAA 


TCG ACC 


TGC 


his 


ser pro 


lys 


ser thr 


cys 








271/91 




CAC 


TAG CGA 


CTG 


CGC CGT 


CGA 


his 


AMB arg 


leu 


arg arg 


arg 








331/111 




TCG 


GGG CAC 


GAG 


AGC ACG 


GAC 


ser 


gly his 


gin 


ser thr 


asp 








391/131 




CGC 


CGG ACG 


AGG 


TCG CGG 


TGT 


arg 


arg thr 


arg 


ser arg 


cys 



SEQ ID N° 8A 
FIGURE 8A 









32/11 




GCG AAA 


ACG 


ACG 


CCT TGT 


CAT 


ala lys 


thr 


thr 


pro cys 


his 








92/31 




CGT TCT 


GAC 


CGG 


ACT TGT 


GAA 


arg ser 


asp 


arg 


thr cys 


glu 








152/51 




GGG TGT 


CGA 


CGC 


ATT CGT 


GGT 


gly cys arg 


arg 


ile arg 


gly 








212/71 




ATT CGC 


CCA 


AAT 


CGA CCT 


GCC 


ile arg 


pro 


asn 


arg pro 


ala 








272/91 




ACT AGC 


GAC 


TGC 


GCC GTC 


GAC 


thr ser 


asp 


cys 


ala val 


asp 








332/111 




CGG GGC 


ACC 


AGA 


GCA CGG 


ACC 


arg gly thr 


arg 


ala arg 


thr 








392/131 




GCC GGA 


CGA 


GGT 


CGC GGT 


GTC 


ala gly arg 


gly 


arg gly 


val 



SEQ ID N° 8B 



PCT/FR98/01813 



TCG CAA 
ser gin 


TCG 
ser 


TCA 
ser 


GCA 
ala 


CCG 
pro 


GCC 
ala 


ACG GGT 
thr gly 


TTC 
phe 


GGG 
gly 


TCG 
ser 


AGG 
arg 


CCG 
pro 


TCA AGG 
ser arg 


CCG 
pro 


GCG 
ala 


CGG 
arg 


CAG 
gin 


GAC 
asp 


CCC AGG 
pro arg 


TTG 
leu 


CTC 
leu 


GTG 
val 


CGC 
arg 


CTG 
leu 


CGA TCC 
arg ser 


GGC 
gly 


AGG 
arg 


GCA 
ala 


CGT 
arg 


CAG 
gin 


CCG GCA 
pro ala 


TGC 
cys 


CGC 
arg 


GGG 
gly 


TCT 
ser 


CGG 
arg 


CGA GCA 
arg ala 


CGC 
arg 


TGG 
trp 


GCC 
ala 


GAA 
glu 


ACC 
thr 


CGC AAT 
arg asn 


CGT 
arg 


CAG 

gin 


CAC 

his 


CGG 
arg 


CCT 
pro 


CGG GTT 
arg val 


TCG 
ser 


GGT 
gly 


CGA 
arg 


GGC 
gly 


CGA 
arg 


CAA GGC 
gin gly 


CGG 
arg 


CGC 
arg 


GGC 
gly 


arg 


act 
thr 


CCA GGT 
pro gly 


TGC 
cys 


TCG 
ser 


TGC 
cys 


GCC 
ala 


TGG 
trp 


GAT CCG 
asp pro 


GCA 
ala 


GGG 
gly 


CAC 
his 


GTC 
val 


AGC 
ser 


CGG CAT 
arg his 


GCC 
ala 


GCG 
ala 


GGT 
gly 


CTC 
leu 


GGA 
gly 


GAG CAC 
glu his 


GCT 
ala 


GGG 
gly 


CCG 
pro 


AAA 
lys 


CCT 
pro 



FEUILLE C»E REMrkft£BflE|}I(REGLE 26) 




WO 99/09186 ^CT/FR98/01813 



23/185 



TTG CGT 


GAT 


GTC 


CAA TGG 


CGA 


leu arg 


asp 


val 


gin trp 


arg 


63/21 








GTT TTC 


GCG 


ATG 


ACG CTC 


GTT 


val phe 


ala 


met 


thr leu 


val 


123/41 










CGA ACC 


GTC 


GAT 


TCC ATG 


GGT 


arg thr 


val 


asp 


ser met 


gly 


183/61 








TTC CTG 


GGT 


TCG 


ACA CCA 


TTC 


phe leu 


gly 


ser 


thr pro phe 


243/81 










GTC TTG 


GCT 


GCC 


GCC CCA 


CTA 


val leu 


ala 


ala 


ala pro 


leu 


303/101 








CGA AAC 


GTC 


ACC 


GCG TTC 


GGG 


arg asn 


val 


thr 


ala phe gly 


363/121 










GGT CGG 


GCG 


CCA 


TCG ACG 


CCG 


gly arg 


ala 


pro 


ser thr 


pro 


423/141 








GGC GAC 


GAT 


C 






gly asp 


asp 















33/11 




AAA 


CGA 


CGC 


CTT GTC ATC 


lys 


arg 


ara 


leu val 


ile 








93/31 




CTG 


ACC 


GGA 


CTT GTG AAC 


leu 


thr 


al v 


leu val 


asn 








153/51 




GTC 


GAC 


GCA 


TTC GTG 


GTC 


val 


asp 


ala 


phe val val 








213/71 




GCC 


CAA 


ATC 


GAC CTG 


CCC 


ala gin 


ile 


asp leu 


pro 








273/91 




GCG 


ACT 


GCG 


CCG TCG 


ACG 


ala 


thr 


ala 


pro ser 


thr 








333/111 




GCA 


CCA 


GAG 


CAC GGA 


CCC 


ala 


pro 


glu 


his gly 


pro 








393/131 




GAC 


GAG 


GTC 


GCG GTG 


TCG 


asp 


glu 


val 


ala val 


ser 



SEQ ID N a 8C 
FIGURE 8C 



GCA ATC 
ala ile 


GTC 
val 


AGC 
ser 


ACC 
thr 


GGC 

giy 


CTA 
leu 


GGG TTT CGG 
gly phe arg 


GTC 
val 


GAG 

glu 


GCC 
ala 


GAG 
glu 


AAG GCC 
lys ala 


GGC 
gly 


GCG 
ala 


GCA 
ala 


GGA 
gly 


CCG 
pro 


CAG GTT 
gin val 


GCT 
ala 


CGT 
arg 


GCG 
ala 


CCT 
pro 


GGC 
gly 


ATC CGG CAG 
ile arg gin 


GGC 
gly 


ACG 
thr 


TCA 
ser 


GCG 
ala 


GGC ATG 
gly met 


CCG 
pro 


CGG 
arg 


GTC 
val 


TCG 
ser 


GAC 
asp 


AGC ACG 
ser thr 


CTG 
leu 


GGC 
gly 


CGA 
arg 


AAC 
asn 


CTC 
leu 



partle de la sequence nucleotidique de seq8A 



1/1 


















31/11 


CAG GTT 


GCT 


CGT 


GCG 


CCT 


GGC 


GTC 


TTG 


GCT 


GCC GCC 


gin val 


ala 


arg 


ala 


pro 


gly 


val 


leu 


ala 


ala ala 


61/21 
















91/31 


ATC CGG 


CAG 


GGC 


ACG 


TCA 


GCG 


CGA 


AAC 


GTC 


ACC GCG 


ile arg 


gin 


gly 


thr 


ser 


ala 


arg 


asn 


val 


thr ala 


121/41 
















151/51 


GGC ATG 


CCG 


CGG 


GTC 


TCG 


GAC 


GGT 


CGG 


GCG 


CCA TCG 


gly met 


pro 


arg 


val 


ser 


asp 


gly 


arg 


ala 


pro ser 


181/61 














AGC ACG 


CTG 


GGC 


CGA AAC 


CTC 


GGC 


GAC 


GAT 


C 


ser thr 


leu 


gly 


arg 


asn 


leu 


gly 


asp 


asp 





SEQ ID N° 8A f 



FIGURE 8A f 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 T 5 CT/FR98/01813 



24/185 



1/1 

AGG TTG CTC GTG 
arg leu leu val 
61/21 

TCC GGC AGG GCA 
ser gly arg ala 
121/41 

GCA TGC CGC GGG 
ala cys arg gly 
181/61 

GCA CGC TGG GCC 
ala arg trp ala 



CGC CTG GCG TCT 
arg leu ala ser 

CGT CAG CGC GAA 
arg gin arg glu 

TCT CGG ACG GTC 
ser arg thr val 

GAA ACC TCG GCG 
glu thr ser ala 



31/U 
TGG CTG CCG CCC 
trp leu pro pro 

91/31 
ACG TCA CCG CGT 
thr ser pro arg 

151/51 
GGG CGC CAT CGA 
gly arg his arg 

ACG ATC 
thr ile 



CAC TAG CGA CTG 
his AMB arg leu 

TCG GGG CAC CAG 
ser gly his gin 

CGC CGG ACG AGG 
arg arg thr arg 



CGC 


CGT 


CGA 


CGA 


arg 


arg 


arg 


arg 


AGC 


ACG 


GAC 


CCG 


ser 


thr 


asp 


pro 


TCG 


CGG 


TGT 


CGA 


ser 


arg 


cys 


arg 



SEQ ID N° 8B T 



FIGURE 8B' 



Seq8C 
1/1 

CCA GGT TGC TCG TGC GCC TGG CGT CTT GGC 
pro gly cys ser cys ala trp arg leu gly 
61/21 

GAT CCG GCA GGG CAC GTC AGC GCG AAA CGT 
asp pro ala gly his val ser ala lys arg 
121/41 

CGG CAT GCC GCG GGT CTC GGA CGG TCG GGC 
arg his ala ala gly leu gly arg ser gly 
181/61 

GAG CAC GCT GGG CCG AAA CCT CGG CGA CGA 
glu his ala gly pro lys pro arg arg arg 



SEQ ID 



31/11 



TGC CGC 


CCC 


ACT 


AGC 


GAC 


TGC 


GCC 


GTC 


GAC 


cys arg 


pro 


thr 


ser 


asp 


cys 


ala 


val 


asp 


91/31 
















CAC CGC 


GTT 


CGG 


GGC 


ACC 


AGA 


GCA 


CGG 


ACC 


his arg 


val 


arg 


gly 


thr 


arg 


ala 


arg 


thr 


151/51 














GCC ATC 


GAC 


GCC 


GGA 


CGA 


GGT 


CGC 


GGT 


GTC 


ala ile 


asp 


ala gly 


arg 


gly 


arg 


gly 


val 



TC 



N° 8C 



FIGURE 8C 1 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 




sequence Rv2563 


predite 


par 


atg 










met 










121/41 










ctt ttt gcg 


gct 


t- j- 
ccg 


cgt 


gat 


leu phe ala 


ala 


leu 


arg 


asp 


1 ft"? / CI 
101/ Ox 










age acc ggc 


eta 


gtt 


ttc 


gcg 


see thr gly 


leu 


val 


phe 


ala 


0*1 tot 










gtc gag gec 


gag 


cga 


acc 


gtc 


val glu ala 


glu 


arg 


thr 


val 


oOl/lOl 










gcg gca gga 


ccg 


ttc 


ctg 


ggt 


ala ala gly 


pro 


phe 


leu 


gly 


361/121 










cgt gcg cct 


ggc 


gtc 


ttg 


get 


arg ala pro 


gly 


val 


leu 


ala 


421/141 










ggc acg tea 


gcg 


cga 


aac 


gtc 


gly thr ser 


ala 


arg 


asn 


val 


401/ lol 










egg gtc teg 


gac 


ggt 


egg 


gcg 


arg val ser 


asp 


gly 


arg 


ala 


541/181 








ggc cga aac 


etc 


ggc 


gac 


gat 


gly arg asn 


leu 


gly 


asp 


asp 


OU1/2U1 






gtg ccc gag 


tea 


acc 


gcg 


ctg 


val pro.uglu 


ser 


thr 


ala 


leu 


/Oil 

OOl/^£l 










cag cag ttg 


gca 


tac 


aac 


gga 


gin gin leu 


ala 


tyr 


asn 


gly 


f ^1/241 










cga cag etc 


ccg 


gac 


ggc 


tat 


arg gin leu 


pro 


asp 


gly 


tyr 


/ol/zbl 












aag 


gtc 


gcg 


gtg 


arg pro leu 


lys 


val 


ala 


val 


Qil 1 /OR 1 
041/ £Ol 










gcg geg ttg 


ate 


gtc 




teg 


ala ala leu 


ile 


val 


gly 


ser 


yui/ oui 








gcg gtg tec 


aag 


gcg 


ate 


ggc 


U i. Q VuX piLC 


xys 


ala 


lie 


gly 


961/321 








gcg gtc gtc 


gtc 


gcg 


ctg 


etc 


ala val val 


val 


ala 


leu 


leu 


1021/341 










ccg ttg ttc 


ccg 


atg 


act 


gtc 


pro leu phe 


pro 


met 


thr 


val 


1081/361 










gcg act gtg 


ate 


ggt 


ctg 


ctg 


ala thr val 


ile 


gly 


leu 


leu 


1141/381 










ccg gca eta 


gcg 


ttc 


gga 


ggt 


pro ala leu 


ala 


phe 


gly 


gly 



25/185 



Cole et 


al. 


(Nature 


393 








151/51 




gtc 


caa 


tgg 


cga aaa 


cga 


val 


gin 


trp 


arg lys 


arg 








211/71 




atg 


acg 


etc 


gtt ctg 


acc 


met 


enr 


leu 


val leu 


thr 








271/91 




gat 


tec 


atg 


ggt gtc 


gac 


asp 


ser 


met 


gly val 


asp 








331/111 




teg 


aca 


cca 


ttc gee 


caa 


ser 


thr 


pro 


phe ala 


gin 








391/131 




gec 


gee 


cca 


eta gcg 


act 


ala 


ala 


pro 


leu ala 


thr 








451/151 




acc 


gcg 


ttc 


ggg gca 


cca 


tnr 


ala 


phe 


gly ala 


pro 








511/171 




cca 


teg 


acg 


ccg gac 


gag 


pro 


ser 


thr 


pro asp 


glu 








571/191 




ctg 


caa 


gtg 


ggt gcg 


cgc 


1 Alt 

leu 


»*i «. 
gin 


val 


gly ala 


arg 








631/211 




gca 


aag 


att 


ccc aac 


ate 


aj_a 


1 tie 

lys 


ile 


pro asn 


ile 








691/231 




cag 


ccg 


aca 


ate agt 


teg 


gin 


pro 


thr 


ile ser 


ser 








751/251 




cag 


ace 


gtc 


aat cga 


gcg 


gin 


tnr 


val 


asn arg 


ala 








811/271 




gat 


gcg 


ate 


acg gtt 


gtg 


asp 


aid 


ile 


thr val 


val 








871/291 






gtc 


tac 


etc tct 


gcg 


val 


val 


tyr 


leu ser 


ala 








931/311 




gtg 


ccg 


acg 


cgc teg 


att 


val 


pro 


thr 


arg ser 


ile 








991/331 




gcg 


gcg 


gtg 


gtt ggc 


ggc 


ala 


ala 


val 


val gly gly 








1051/351 


gtg 


gta 


ccc 


ctg agt 


gee 


val 


val 


pro 


leu ser 


ala 








1111/37] 




gec 


age 


gtc 


gca gga 


ctg 


ala 


ser 


val 


ala gly 


leu 



ccc tag 
pro AMB 



SEQ ID N° 8D 



^ffe/FR98/01813 



537-544) et contenant seqSA' 



cgc 
arg 


ctt 
leu 


gtc 
val 


ate 
ile 


gca 
ala 


ate 
ile 


gtc 
val 


gga 
gly 


ctt 
leu 


gtg 
val 


aac 
asn 


ggg 

gly 


ttt 
phe 


egg 
arg 


gca 

ala 


ttc 
phe 


gtg 
val 


gtc 
val 


aag 
lys 


gec 
ala 


ggc 
gly 


ate 
ile 


gac 
asp 


ctg 
leu 


ccc 
pro 


cag 
gin 


gtt 
val 


get 
ala 


gcg 
ala 


ccg 
pro 


teg 
ser 


acg 
thr 


ate 
ile 


egg 
arg 


cag 
gin 


gag 
glu 


cac 
his 


gga 
gly 


ccc 
pro 


ggc 
gly 


atg 
met 


ccg 
pro 


gtc 
val 


gcg 
ala 


gtg 
val 


teg 
ser 


age 
ser 


acg 
thr 


ctg 
leu 


act 
thr 


ttg 
leu 


egg 
arg 


ate 
ile 


gtc 
val 


ggc 
gly 


ate 
ile 


ttc 
phe 


ctg 
leu 


acc 
thr 


acc 
thr 


gaa 
glu 


ggc 
gly 


eta 
leu 


ate 
ile 


ggg 

gly 


ate 
ile 


gac 
asp 


ggg 

gly 


atg 
met 


ccc 
pro 


gat 
asp 


get 
ala 


gtc 
val 


age 
ser 


gat 

asp 


ctg 
leu 


atg 
met 


gcg 
ala 


gtc 
val 


ttg 
leu 


ctg 
leu 


tgg 
trp 


ate 
ile 


gtt 
val 


ttg 
leu 


gag 
glu 


egg 
arg 


ctg 
leu 


cgt 
arg 


gac 
asp 


ttt 
phe 


ctg 
leu 


gec 
ala 


ggg 

gly 


ctg 
leu 


gcg 
ala 


ctg 
leu 


cag 
gin 


ate 
ile 


ctt 
leu 


teg 
ser 


ctg 
leu 


ctg 

leu 


ttg 
leu 


gcg 
ala 


ttc 
phe 


gtg 
val 


gcg 
ala 


eta 
leu 


ccg 
pro 


gcg 
ala 


ate 
ile 


egg 
arg 


cgc 
arg 


gtg 
val 


gtg 
val 


gcg 
ala 


ate 
ile 


gat 
asp 



FEUILLE DE REMA3ftIffiEti? (REGLE 26) 



WO 99/09186 




:T/FR98/01813 



26/185 

ORF predite par_Cole et al. (Nature 393:537-544) et contenant Rv2563 
1/1 31/11 

tag gtt tea aga agg cct gtg cag gtt tec gca gec tgg gec gcg gcg cca ccg aag age 
AMB val ser arg arg pro val gin val ser ala ala trp ala ala ala pro pro lys ser 
61/21 91/31 

ccg ccg aaa tgg get aat egg gtt cgc ttg get cga teg ccg atg ate teg acc gec acg 
pro pro lys trp ala asn arg val arg leu ala arg ser pro met ile ser thr ala thr 
121/41 151/51 

acc gac ccc etc acc teg gtc gaa cct egg cga acc aac gcg gca acg cca gee cat gat 
thr asp pro leu thr ser val glu pro arg arg thr asn ala ala thr pro ala his asp 
181/61 211/71 

cat ttg att ggg tec acg gaa gca ggt age ttc cgt cgc atg ctt ttt gcg get ttg cgt 
his leu ile gly ser thr glu ala gly ser phe arg arg met leu phe ala ala leu arg 
241/81 271/91 

gat gtc caa tgg cga aaa cga cgc ctt gtc ate gca ate gtc age acc ggc eta gtt ttc 
asp val gin trp arg lys arg arg leu val ile ala ile val ser thr gly leu val phe 
301/101 331/111 

gcg atg acg etc gtt ctg acc gga ctt gtg aac ggg ttt egg gtc gag gec gag cga acc 
ala met thr leu val leu thr gly leu val asn gly phe arg val glu ala glu aro thr 
361/121 391/131 

gtc gat tec atg ggt gtc gac gca ttc gtg gtc aag gec ggc gcg gca gga ccg ttc ctg 
val asp ser met gly val asp ala phe val val lys ala gly ala ala gly pro phe leu 
421/141 451/151 

ggt teg aca cca ttc gec caa ate gac ctg ccc cag gtt get cgt gcg cct ggc gtc ttg 
gly ser thr pro phe ala gin ile asp leu pro gin val ala arg ala pro gly val leu 
481/161 511/171 

get gec gec cca eta gcg act gcg ccg teg acg ate egg cag ggc acg tea gcg cga aac 
ala ala ala pro leu ala thr ala pro ser thr ile arg gin gly thr ser ala arg asn 
541/181 571/191 

gtc acc gcg ttc ggg gca cca gag cac gga ccc ggc atg ccg egg gtc teg gac ggt egg 
val thr ala phe gly ala pro glu his gly pro gly met pro arg val ser asp gly arq 
601/201 631/211 

gcg cca teg acg ccg gac gag gtc gcg gtg teg age acg ctg ggc cga aac etc ggc gac 
ala pro ser thr pro asp glu val ala val ser ser thr leu gly arg asn leu gly aso 
661/221 691/231 

gat ctg caa gtg ggt gcg cgc act ttg egg ate gtc ggc ate gtg ccc gag tea acc gcg 
asp leu gin val gly ala arg thr leu arg ile val gly ile val pro glu ser thr ala 
721/241 751/251 

ctg gca aag att ccc aac ate ttc ctg acc acc gaa ggc eta cag cag ttg gca tac aac 
leu ala lys ile pro asn ile phe leu thr thr glu gly leu gin gin leu ala tyr asn 
781/261 811/271 

gga cag ccg aca ate agt teg ate ggg ate gac ggg atg ccc cga cag etc ccg gac ggc 
gly gin pro thr ile ser ser ile gly ile asp gly met pro arg gin leu pro aso alv 
841/281 871/291 P P 9 Y 

tat cag acc gtc aat cga gcg gat get gtc age gat ctg atg cgc ccg ttg aag gtc gcg 
tyr gin thr val asn arg ala asp ala val ser asp leu met arg pro leu lys val ala 
901/301 931/311 

gtg gat gcg ate acg gtt gtg gcg gtc ttg ctg tgg ate gtt gcg gcg ttg ate gtc ggc 
val asp ala ile thr val val ala val leu leu trp ile val ala ala leu ile val alv 
961/321 991/331 

teg gtg gtc tac etc tct gcg ttg gag egg ctg cgt gac ttt gcg gtg ttc aag gcg ate 
ser val val tyr leu ser ala leu glu arg leu arg asp phe ala val phe lys ala ile 
1021/341 1051/351 

ggc gtg ccg acg cgc teg att ctg gec ggg ctg gcg ctg cag gcg gtc gtc gtc gcg ctg 
gly val pro thr arg ser ile leu ala gly leu ala leu gin ala val val val ala leu 
1081/361 1111/371 

etc gcg gcg gtg gtt ggc ggc ate ctt teg ctg ctg ttg gcg ccg ttg ttc ccg atg act 
leu ala ala val val gly gly ile leu ser leu leu leu ala pro leu phe pro met th- 
1141/381 1171/391 

gtc gtg gta ccc ctg agt gee ttc gtg gcg eta ccg gcg ate gcg act gtg ate ggt ctg 
val val val pro leu ser ala phe val ala leu pro ala ile ala thr val ile alv leu 
1201/401 1231/411 

ctg gee age gtc gca gga ctg egg cgc gtg gtg gcg ate gat ccg gca eta gcg ttc gga 
leu ala ser val ala gly leu arg arg val val ala ile asp pro ala leu ala phe alv 
1261/421 *■ **/ 

ggt ccc tag 
gly pro AMB 

SEQ ID N° 8F 
FEUILLE DE REMfi3&EfflEftT (REGLE 26) 




WO 99/09186 ^tT/FR98/0l813 



TC173 



27/185 



sequence de Rv0072 predite par par Cole et al. (Nature 393:537-544) et 
presentant plus de 77% de similarite avec SeqSD' 
1/1 31/11 

caa tgg aga aag 
gin trp arg lys 

91/31 
acg ctt gtt ttg 
thr leu val leu 

151/51 
tec atg ggt gtc 
ser met gly val 

211/71 
ata ccg ttt ccc 
ile pro phe pro 

271/91 
gcc ccg ttg ggc 
ala pro leu gly 

331/111 
gtc ttc ggc gcg 
val phe gly ala 

391/131 
teg aaa ccg gac 
ser lys pro asp 

451/151 
gag gtc ggc gcg 
glu val gly ala 

511/171 
aag ate ccc aat 
lys ile pro asn 

. 571/191 
ccg aat ate acg 
pro asn ile thr 

631/211 
act ttc gat egg 
thr phe asp arg 
691/231 
aat teg ate teg ate 
ser ile ser ile 

751/251 
gtg tac ctt teg 
val tyr leu ser 

811/271 
cca acg cgc teg 
pro thr arg ser 

871/291 
gcg gtg gtg ggc 
ala val val gly 

931/311 
gta ccc gtc ggt 
val pro val gly 

991/331 
agf gtt gcc gga 
ser val ala gly 

tag 



atg etc 
Met leu 
61/21 


ttc 
phe 


gcg 
ala 


gcc 
ala 


ctg 
leu 


cgt 
arg 


gac 
asp 


atg 
met 


ate age 
ile ser 
121/41 


ace 
thr 


ggg 

gly 


ctg 
leu 


ate 
ile 


ttc 
phe 


ggg 

gly 


atg 
met 


egg gtg 
arg val 
181/61 


gag 
glu 


gcc 
ala 


egg 

arg 


cac 
his 


ace 
thr 


gtc 
val 


gat 
asp 


ggc get 
gly ala 
241/81 


get 

ala 


gga 
gly 


cct 
pro 


ttt 
phe 


ctg 
leu 


ggt 
gly 


tea 
ser 


gcc get 
ala ala 
301/101 


gaa 
glu 


ccc 
pro 


ggt 
gly 


gtc 
val 


atg 
met 


gcc 
ala 


gcg 
ala 


gaa ggc 
glu gly 
361/121 


acg 
thr 


teg 
ser 


acg 
thr 


cga 
arg 


aac 
asn 


gtc 
val 


acg 
thr 


cca egg 
pro arg 
421/141 


gtc 
val 


tea 
ser 


gag 
glu 


ggt 
gly 


egg 
arg 


tea 
ser 


ccg 
pro 


atg ggc 
met gly 
481/161 


cga 
arg 


cac 
his 


etc 
leu 


ggt 
gly 


gac 
asp 


act 
thr 


gtc 
val 


att gtg 
ile val 
541/181 


ccg 
pro 


aat 
asn 


tec 
ser 


ace 
thr 


gcg 
ala 


ctg 
leu 


gcc 
ala 


tta cag 
leu gin 
601/201 


aaa 
lys 


ttg 
leu 


gcg 
ala 


tac 
tyr 


aac 
asn 


ggg 

gly 


cag 
gin 


ccc cga 
pro arg 
661/221 


cag 
gin 


ctg 
leu 


ccg 
pro 


gag 

glu 


ggt 

gly 


tac 
tyr 


cag 
gin 


gtg cgc 
val arg 
721/241 


cca 
pro 


ttg 
leu 


aag 
lys 


gtc 
val 


gca 
ala 


gtg 
val 


aat 
asn 


gtg gcg 
val ala 
781/261 


gtg 
val 


ctg 
leu 


ate 
ile 


gtc 
val 


ggc 

Siy 


teg 
ser 


gtg 
val 


ttc gcg 
phe ala 
841/281 


gtg 
val 


ttc 
phe 


aag 
lys 


gcg 
ala 


att 
ile 


ggc 
gly 


acg 
thr 


cag gcg 
gin ala 
901/301 


ctg 
leu 


gtc 
val 


att 
ile 


gcg 
ala 


ttg 
leu 


ctt 
leu 


gcg 
ala 


gca cca 
ala pro 
961/321 


ctg 
leu 


ttt 
phe 


ccg 
pro 


atg 
met 


att 
ile 


gtc 
val 


gcg 
ala 


gcc gcg ate 
ala ala ile 
1021/341 


gtc 
val 


ate 
ile 


ggt 
gly 


ctg 
leu 


ttc 
phe 


get 
ala 


gat ccc 
asp pro 


gcg 
ala 


cag 
gin 


gcg 
ala 


ttc 
phe 


gga 
gly 


ggt 
gly 


ccc 
pro 



cgc cgc 
arg arg 


ctg 
leu 


gtc 
val 


ate 
ile 


acg ate 
thr ile 


ace gga 
thr gly 


etc 
leu 


gcg 

ala 


aac 
asn 


ggc ttc 
gly phe 


gat gta 
asp val 


ttc 
phe 


gtc 
val 


gtc 
val 


aga tec 
arg ser 


gat gtt 
asp val 


gac 
asp 


ctg 
leu 


gcc 
ala 


cga gtg 
arg val 


age gtg 
ser val 


ggg 

gly 


acg 
thr 


ate 
ile 


atg aaa 
met lys 


ccc gag 
pro glu 


cac 
his 


gga 
gly 


cct 
pro 


ggc atg 
gly met 


gaa gtc 
glu val 


gcg 
ala 


gca 
ala 


teg 
ser 


age acg 
ser thr 


cgc aga 
arg arg 


ttg 
leu 


egg 
arg 


gtc 
val 


gtt ggc 
val gly 


gtc ttc 
val phe 


etc 
leu 


acg 
thr 


ace 
thr 


gag ggc 
glu gly 


tec ate 
ser ile 


ggg 

gly 


ate 
ile 


ata 
ile 


ggt atg 
gly met 


gtg ggc 
val gly 


get 
ala 


gtc 
val 


aat 
asn 


gat ttg 
asp leu 


gtg get 
val ala 


gtt 
val 


ttg 
leu 


ctg 
leu 


tgg att 
trp ile 


get ctt 
ala leu 


gag 
glu 


egg 
acg 


eta 
leu 


cgt gac 
arg asp 


att atg 
ile met 


gcc 
ala 


ggg 

gly 


etc 
leu 


gca tta 
ala leu 


gtc gtc 
val val 


ctg 
leu 


gcg 
ala 


cag 
gin 


gtg ttg 
val leu 


get tac 
ala tyr 


ctg 
leu 


gcg 
ala 


eta 
leu 


ccg gtg 
pro val 


ttg aag 
leu lys 


cgc 
arg 


gtg 
val 


gtg 
val 


acg gtc 
thr val 



SEQ ID N° 8G 



FEUILLE DE REMPt*©gMElfP(REGLE 26) 



WO 99/09186 ^^T/FR98/01813 

28/185 



Seq8H : 


ORF 


predite 


1/1 








tag cct 


ctg 


gga 


atg 


AMB pro 


leu 


gly 


met 


61/21 








gtc ate 


acg 


ate 


ate 


val ile 


thr 


ile 


ile 


121/41 








gcg aac 


ggc 


ttc 


egg 


ala asn 


giy 


phe 


arg 


181/61 








gtc gtc 


aga 


tec 


ggc 


val val 


arg 


ser 


gly 


241/81 








ctg gec 


eg a 


gtg 


gec 


leu ala 


arg 


val 


ala 


301/101 








acg ate 


atg 


aaa 


gaa 


thr ile 


met 


lys 


glu 


361/121 








gga cct 


ggc 


atg 


cca 


gly pro 


gly 


met 


pro 


421/141 








gca teg 


age 


acg 


atg 


ala ser 


ser 


thr 


met 


481/161 








egg gtc 


gtt 


ggc 


att 


arg val 


val 


gly 


ile 


541/181 






acg acc 


gag 


ggc 


tta 


thr thr 


glu 


gly 


leu 


601/201 








ate ata 


ggt 


•atg 


ccc 


ile ile 


gly 


met 


pro 


661/221 








gtc aat 


gat 


ttg 


gtg 


val asn 


asp 


leu 


val 


721/241 








ttg ctg 


tgg 


att 


gtg 


leu leu 


trp 


ile 


val 


781/261 








egg eta 


cgt 


gac 


ttc 


arg leu 


arg 


asp 


phe 


841/281 








ggg etc 


gca 


tta 


cag 


gly leu 


ala 


leu 


gin 


901/301 






gcg cag 


gtg 


ttg 


gca 


ala gin 


val 


leu 


ala 


961/321 








gcg eta 


ccg 


gtg 


gee 


ala leu 


pro 


val 


ala 


1021/341 






gtg gtg 


acg 


gtc 


gat 


val val 


thr 


val 


asp 



par Cole et al. 



etc 
leu 


ttc 
phe 


gcg 
ala 


gee 
ala 


ctg 
leu 


age 
ser 


acc 
thr 


ggg 

gly 


ctg 
leu 


ate 
ile 


gtg 
val 


gag 
glu 


gee 
ala 


egg 
arg 


cac 
his 


get 
ala 


get 
ala 


gga 
gly 


cct 
pro 


ttt 
phe 


get 
ala 


gaa 
glu 


ccc 
pro 


ggt 
gly 


gtc 
val 


ggc 
gly 


acg 
thr 


teg 
ser 


acg 
thr 


cga 
arg 


egg 
arg 


gtc 
val 


tea 
ser 


gag 
glu 


ggt 
gly 


ggc 
gly 


cga 
arg 


cac 
his 


etc 
leu 


ggt 
gly 


gtg 
val 


ccg 
pro 


aat 
asn 


tec 
ser 


acc 
thr 


cag 
gin 


aaa 
lys 


ttg 
leu 


gcg 
ala 


tac 
tyr 


cga 
arg 


cag 
gin 


ctg 
leu 


ccg 
pro 


gag 
glu 


cgc 
arg 


cca 
pro 


ttg 
leu 


aag 
lys 


gtc 
val 


gcg 
ala 


gtg 
val 


ctg 
leu 


ate 
ile 


gtc 
val 


gcg 
ala 


gtg 
val 


ttc 
phe 


aag 
lys 


gcg 
ala 


gcg 
ala 


ctg 
leu 


gtc 
val 


att 
ile 


gcg 
ala 


cca 
pro 


ctg 
leu 


ttt 
phe 


ccg 
pro 


atg 
met 


gcg 
ala 


ate 
ile 


gtc 
val 


ate 
ile 


ggt 
gly 


ccc 
pro 


gcg 
ala 


cag 
gin 


gcg 

ala 


ttc 
phe 



.ure 393:537- 


-544) 


et 


31/11 








cgt gac atg caa 


tgg 


arg asp met gin 


trp 


91/31 






ttc ggg 


atg 




Ctt 


phe gly met 


thr 


leu 


151/51 








acc gtc 


gat 


tec 


ata 


thr val 


asp 


ser 


met 


211/71 








ctg ggt 


tea 


ata 


cca 


leu gly 


ser 


ile 


Dro 


271/91 






atg gec 


gcg 


gee 


cca 


met ala 


ala 


ala 


pro 


331/111 






aac gtc 


acg 


gtc 


ttc 


asn val 


thr 


val 


phe 


391/131 






egg tea 


ccg 


teg 


aaa 


arg ser 


pro 


ser 


lvs 


451/151 








gac act 


gtc gag 


gtc 


asp thr val glu 


val 


511/171 








gcg ctg 


gec 


aag 


ate 


ala leu 


ala lys 


ile 


571/191 








aac ggg 


cag 


ccg 


aat 


asn gly 


gin pro 


asn 


631/211 








ggt tac 


cag 


act 


ttc 


gly tvr 


gin 


thr 


phe 


691/231 








gca gtg 


aat 


teg 


ate 


ala val 


asn 


ser 


ile 


751/251 








ggc teg 


gtg 


gtg 


tac 


gly ser 


val 


val 


tyr 


811/271 








att ggc 


acg 


cca 


acg 


ile gly thr pro 


thr 


871/291 








ttg ctt 


gcg 


gcg 


gtg 


leu leu 


ala 


ala 


val 


931/311 








att gtc 


gcg 


gta 


ccc 


ile val 


ala 


val 


pro 


991/331 






ctg ttc 


get 


agt 


gtt 


leu phe 


ala 


ser 


val 


1051/351 






gga ggt 


ccc 


tag 




gly gly 


pro 


AMB 





contenant seq8G 



aga 
arg 


aag 
lys 


cgc 
arg 


cgc ctg 
arg leu 


gtt 
val 


ttg 
leu 


acc 
thr 


gga 
gly 


etc 
leu 


ggt 
gly 


gtc 
val 


gat 
asp 


gta ttc 
val phe 


ttt 
phe 


ccc 
pro 


gat 
asp 


gtt gac 
val asp 


ttg 
leu 


ggc 
gly 


age 
ser 


gtg 
val 


ggg 

gly 


ggc 
gly 


gcg 
ala 


ccc 
pro 


gag cac 
glu his 


ccg 
pro 


gac 
asp 


gaa 
glu 


gtc 
val 


gcg 
ala 


ggc 
gly 


gcg 
ala 


cgc 
arg 


aga 
arg 


ttg 
leu 


ccc 
pro 


aat 
asn 


gtc 
val 


ttc etc 
phe leu 


ate 
ile 


acg 
thr 


tec 
ser 


ate 
ile 


ggg 

gly 


gat 
asp 


egg 
arg 


gtg 
val 


ggc get 
gly ala 


teg 
ser 


ate 
ile 


gtg 
val 


get 
ala 


gtt 
val 


ctt 
leu 


teg 
ser 


get 
ala 


ctt 
leu 


gag 
glu 


cgc 
arg 


teg 
ser 


att 
ile 


atg gec 
met ala 


gtg 
val 


ggc 
gly 


gtc 
val 


gtc ctg 
val leu 


gtc 
val 


ggt 
gly 


get 
ala 


tac 
tyr 


ctg 
leu 


gec 
ala 


gga 

giy 


ttg 
leu 


aag 
lys 


cgc 
arg 



SEQ ID N° 8H 
FEUILLE DE REMFOOBISEStI (REGLE 26) 




WO 99/09186 ^CT/FR98/01813 

29/185 



CGA GGC CGA GCG AAC 
arg gly arg ala asn 
61/21 

GGC AGG ACC GTT CCT 
gly arg thr val pro 
121/41 

TGC GCC TGG CGT CTT 
cys ala trp arg leu 
181/61 

CAC GTC AGC GCG AAA 
his val ser ala lys 
241/81 

GGT CTC GGA CGG TCG 
gly leu gly arg ser 
301/101 

CCG AAA CCT CGG CGA 
pro lys pro arg arg 



CGT CGA TTC CAT GGG 
arg arg phe his gly 

GGG TTC GAC ACC ATT 
gly phe asp thr ile 

GGC TGC CGC CCC ACT 
gly cys arg pro thr 

CGT CAC CGC GTT CGG 
arg his arg val arg 

GGC GCC ATC GAC GCC 
gly ala ile asp ala 

CGA TC 
arg 



31/11 

TGT CGA CGC ATT CGT 
cys arg arg ile arg 
91/31 

CGC CCA AAT CGA CCT 
arg pro asn arg pro 
151/51 

AGC GAC TGC GCC GTC 
ser asp cys ala val 
211/71 

GGC ACC AGA GCA CGG 
gly thr arg ala arg 
271/91 

GGA CGA GGT CGC GGT 
gly arg gly arg gly 



GGT CAA GGC CGG CGC 
qly gin gly arg arg 

GCC CCA GGT TGC TCG 
ala pro gly cys ser 

GAC GAT CCG GCA GGG 
asp asp pro ala gly 

ACC CGG CAT GCC GCG 
thr arg his ala ala 

GTC GAG CAC GCT GGG 
val glu his ala gly 



SEQ ID N° 9A 
FIGURE 9A 



GAG GCC GAG CGA ACC GTC GAT 
glu ala glu arg thr val asp 
62/21 

GCA GGA CCG TTC CTG GGT TCG 
ala gly pro phe leu gly ser 
122/41 

GCG CCT GGC GTC TTG GCT GCC 
ala pro gly val leu ala ala 
182/61 

ACG TCA GCG CGA AAC GTC ACC 
thr ser ala arg asn val thr 
242/81 

GTC TCG GAC GGT CGG GCG CCA 
val ser asp gly arg ala pro 
302/101 

CGA AAC CTC GGC GAC GAT C 
arg asn leu gly asp asp 









32/11 




TCC 


ATG 


GGT 


GTC GAC 


GCA 


ser 


met 


gly 


val asp 


ala 








92/31 




ACA 


CCA 


TTC 


GCC CAA 


ATC 


thr 


pro 


phe 


ala gin 


ile 








152/51 




GCC 


CCA 


CTA 


GCG ACT 


GCG 


ala 


pro 


leu 


ala thr 


ala 








212/71 




GCG 


TTC 


GGG 


GCA CCA 


GAG 


ala phe 


gly 


ala pro 


glu 








272/91 




TCG 


ACG 


CCG 


GAC GAG 


GTC 


ser 


thr 


pro 


asp glu 


val 



TTC GTG GTC AAG GCC GGC GCG 
phe val val lys ala gly ala 

GAC CTG CCC GAG GTT GCT CGT 
asp leu pro gin val ala arg 

CCG TCG ACG ATC CGG CAG GGC 
pro ser thr ile arg gin gly 

CAC GGA CCC GGC ATG CCG CGG 
his gly pro gly met. pro arg 

GCG GTG TCG AGC ACG CTG GGC 
ala val ser ser thr leu gly 



SEQ ID N° 9B 



FIGURE 9B 



FEUILLE DE REMPLACEMENT (REGLE 26) 




WO 99/09186 PCT/FR98/01813 



30/185 



AGG CCG AGC 


GAA 


CCG 


TCG 


ATT 


CCA 


TGG 


GTG 


arg pro ser 
63/21 


glu 


pro 


ser 


ile 


Dro 


trp 


val 


CAG GAC CGT 


TCC 


TGG 


GTT 


CGA 


CAC 


CAT 


TCG 


gin asp arg 
123/41 


ser 


trp 


val 


arg 


his 


his 


ser 


CGC CTG GCG 


TCT 


TGG 


CTG 


CCG 


CCC 


CAC 


TAG 


arg leu ala 
183/61 


ser 


trp 


leu 


pro 


pro 


his 


AMB 


CGT CAG CGC 


GAA 


ACG 


TCA 


CCG 


CGT 


TCG 


GGG 


arg gin arg 

243/81 

TCT CGG ACG 


glu 


thr 


ser 


pro 


arg 


ser 


gly 


GTC 


GGG 


CGC 


CAT 


CGA 


CGC 


CGG 


ser arg thr 
303/101 


val 


gly 


arg 


his 


arg 


arg 


arg 


GAA ACC TCG 


GCG 


ACG 


ATC 










glu thr. ser 


ala 


thr 


ile 











33/11 



TCG ACG CAT 


TCG 


TGG 


TCA AGG 


CCG 


GCG 


CGG 


ser thr his 
93/31 


ser 


trp ser arg 


pro 


ala 


arg 


CCC AAA TCG ACC 


TGC 


CCC 


AGG 


TTG 


CTC 


GTG 


pro lys ser 
153/51 


thr 


cys 


pro 


arg 


leu 


leu 


val 


CGA CTG CGC 


CGT 


CGA 


CGA 


TCC 


GGC 


AGG 


GCA 


arg leu arg 
213/71 


arg 


arg 


arg 


ser 


gly 


arg 


ala 


CAC CAG AGC ACG 


GAC 


CCG 


GCA 


TGC 


CGC 


GGG 


his gin ser 
273/91 


thr 


asp 


pro 


ala 


cys 


arg gly 


ACG AGG TCG 


CGG 


TGT 


CGA 


GCA 


CGC 


TGG 


GCC 


thr arg ser 


arg 


cys 


arg 


ala 


arg 


trp ala 



TTA ACG ACT CAG 


ACG 


GAA 


ACG 


leu thr 


thr gin 


thr 


glu 


thr 


61/21 








GCT CTT TGG .CAA 


TTG 


AAG 


GTG 


ala leu 


trp gin 


leu 


lys 


val 


121/41 








ATC AAT 


CGC CGG 


CTC 


GCG 


GAC 


ile asn 


arg arg 


leu 


ala 


asp 


181/61 








GGG TCC 


TTT GTG 


ACT 


GCC 


GGG 


gly ser 


phe val 


thr 


ala 


gly 


241/81 








CTA CCG 


TTC TGA 


CCT 


GGG 


GCT 


leu pro phe OPA 


pro 


gly 


ala 


301/101 






GGC CCA 


CCG CCA 


CCT 


CGG 


TCG 


gly pro 


pro pro 


pro 


arg 


ser 


361/121 










CTT GTT 


CGC ATC 


GTT 


GGT 


GTC 


leu val 


arg ile 


val 


gly 


val 


421/141 








GGC GGT 


CGT GCC 


GCG 


CAT 


GCG 


gly gly 


arg ala 


ala 


his 


ala 



SEQ ID N° 9C 
FIGURE 9C 









31/11 




CTT 


GAA 


CCG 


CGA GGT 


CGC 


leu 


glu 


pro 


arg gly 


arg 








91/31 




AGC 


TGC 


GAG 


CAG CCG 


GGT 


ser 


cys 


glu 


gin pro 


gly 








151/51 


GTA 


GAT 


AAT 


CAG CTC 


ACC 


val 


asp 


asn 


gin leu 


thr 








211/71 




CTT 


GAC 


GCG 


GAC GAC 


CAC 


leu 


asp 


ala 


asp asp 


his 








271/91 




GCG 


TGG 


GCG 


CCG ACG 


ACG 


ala 


trp 


ala 


pro thr 


thr 








331/111 




CCG 


GCA 


GTA 


TGT CAG 


CAT 


pro 


ala 


val 


cys gin 


his 








391/131 




GTG 


GTT 


GCG 


ACG ACC 


TTG 


val 


val 


ala 


thr thr 


leu 



GAT C 
asp 



SEQ ID N° 10A 
FIGURE 10A 



TCC GGA CAC CAA TTT GAC TCG 
ser gly his gin phe asp ser 

GAC CGC ATC GTT GGC CTT GCC 
asp arg ile val gly leu ala 

GTT GGG ACC GAC CTC GAC CAG 
val gly thr asp leu asp gin 

AGA GTC GGT CAT CGC CTA AGG 
arg val gly his arg leu arg 

TGA GGC ACG TCA TGT CTC AGC 
OPA gly thr ser cys leu ser 

GTG CAG ATG ACT CCA CGC AGC 
val gin met thr pro arg ser 

GCG CTG GTG AGC GCA CCC GCC 
ala leu val ser ala pro ala 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



CT/FR98/01813 



31/185 



32/11 

TAA CGA CTC AGA CGG AAA CGC TTG AAC CGC GAG GTC GCT CCG GAC ACC AAT TTG ACT CGG 

^/9i r9 " 9 lyS a£g lGU asn arg glu Val aia P ro as P thr as " leu thr arg 
62/21 92/31 

CTC TTT GGC AAT TGA AGG TGA GCT GCG AGC AGC CGG GTG ACC GCA TCG TTG GCC TTG CCA 
leu phe gly asn OPA arg OPA ala ala ser ser arg val thr ala ser leu ala leu pro 
122/41 152/51 P 

TCA ATC GCC GGC TCG CGG ACG TAG ATA ATC AGC TCA CCG TTG GGA CCG ACC TCG ACC AGG 
182/6^ 9 V M ilC ile III,™* Pr ° leU P» th ' s « thr arg 

GGT CCT TTG TGA CTG CCG GGC TTG ACG CGG ACG ACC ACA GAG TCG GTC ATC GCC TAA GGC 

j«/!r u pro gly leu thr arg 2? 2 r thr thr giu ser vai iie aia och 

TAC CGT TCT GAC CTG GGG CTG CGT GGG CGC CGA CGA CGT GAG GCA CGT CAT GTC TCA GCG 
302/10? ^ g ^ a ^ arg til/Hi arg a£g hiS Val SSr ala 

GCC CAC CGC GAC CTC GGT CGC CGG CAG TAT GTC AGC ATG TGC AGA TGA CTC CAC GCA GCC 

arg g 7 drg gln tyr Val SGC met cys ar * 0PA leu his a ^ ala 

362/121 392/131 

TTG TTC GCA TCG TTG GTG TCG TGG TTG CGA CGA CCT TGG CGC TGG TGA GCG CAC CCG CCG 

422/m Ser val ser trp leu arg arg pro trp arg trp 0PA aia his P ro P« 

GCG GTC GTG CCG CGC ATG CGG ATC 
ala val val pro arg met arg Ile 



SEQ ID N° 10B 



FIGURE 10B 



AAC GAC TCA GAC GGA AAC GCT 
asn asp ser asp gly asn ala 
63/21 

TCT TTG GCA ATT GAA GGT GAG 
ser leu ala ile glu gly glu 
123/41 

CAA TCG CCG GCT CGC GGA CGT 
gin ser pro ala arg gly arg 
183/61 

GTC CTT TGT GAC TGC CGG GCT 
val leu cys asp cys arg ala 
243/81 

ACC GTT CTG ACC TGG GGC TGC 
thr val leu thr trp gly cys 
303/101 

CCC ACC GCC ACC TCG GTC GCC 
pro thr ala thr ser val ala 
363/121 

TGT TCG CAT CGT TGG TGT CGT 
cys ser his arg trp cys arg 
423/141 

CGG TCG TGC CGC GCA TGC GGA 
arg ser cys arg ala cys gly 









33/11 


TGA ACC 


GCG 


AGG TCG CTC 


OPA 


thr 


ala 


arg ser leu 








93/31 


CTG 


CGA 


GCA 


GCC GGG TGA 


leu 


arg 


ala 


ala gly OPA 








153/51 


AGA 


TAA 


TCA 


GCT CAC CGT 


arg 


OCH 


ser 


ala his arg 








213/71 


TGA CGC 


GGA 


CGA CCA CAG 


OPA 


arg 


gly 


arg pro gin 








273/91 


GTG 


GGC 


GCC 


GAC GAC GTG 


val 


gly 


ala 


asp asp val 








333/111 


GGC 


AGT 


ATG 


TCA GCA TGT 


gly 


ser 


met 


ser ala cys 








393/131 


GGT 


TGC 


GAC 


GAC CTT GGC 


gly cys 


asp 


asp leu gly 


TC 









CGG ACA CCA ATT TGA CTC GGC 
arg thr pro ile OPA leu gly 

CCG CAT CGT TGG CCT TGC CAT 
pro his arg trp pro cys his 

TGG GAC CGA CCT CGA CCA GGG 
trp asp arg pro arg pro gly 

AGT CGG TCA TCG CCT AAG GCT 
ser arg ser ser pro lys ala 

AGG CAC GTC ATG TCT CAG CGG 
arg his val met ser gin arg 

GCA GAT GAC TCC ACG CAG CCT 
ala asp asp ser thr gin pro 

GCT GGT GAG CGC ACC CGC CGG 
ala gly glu arg thr arg arg 



SEQ ID N° 10C 



FEUILLE DE REWI^^ISieW^REGLE 26) 



WO 99/09186 PCT/FR98/01813 



32/185 



31/U 



CCC GAA 


GAG 


GTC 


CCC 


CGT 


TTT 


GTT AAT TTT TAA AAA 


ATT 


TGT 


GTC 


ACA AAC CGG 


GGT 


ACC 


pro glu 


glu 


vai 


pro 


arg 


pne 


val asp phe OCH lys 


ile 


cys 


val 


thr lys arg 


gly 


thr 


OX/ 61 












91/31 










Afw OCA 




aft/** 


CTA 


GTA 


CCT 


GGG GCG GCG GAT TCA 


ACG AAA 


ACC 


GAG TGG GGG 


TAG 


TCA 


lys ala 




asn 


leu 


vai 


pro 


gly ala ala asp ser 


thr lys 


thr glu trp gly 


AMB 


ser 














1 C 1 /CI 

151/ 51 














GGG GCG 


TGC 


ATT 


CCG 


ACG 


ACC 


CTG TAC GAC CCG CTG 


GTG 


GCA 


ACG 


CCG ATG AGT 


GCG 


CCG 


gly ala 


cys 


lie 


pro 


tnr 


tnr 


leu tyr asp pro leu 


val 


ala 


thr 


pro met ser 


ala 


pro 


181/61 












211/71 










ACG AAG 


GCC 


GAG 


CGA 


CGG 


GCT 


GCC GGC GCT GAC CGC 


CGC 


GGA 


AGC 


CGC CGA GTG 


CAT 


GGT 


thr lys 


ala 


glu 


arg 


arg 


ala 


ala gly ala asp arg 


arg gly 


ser 


arg arg val 


asp 


gly 


241/91 




















CAC CAC 


CGC 


CCG 


CAC 


CCG 


ACC 


GGT ACG GAT CGC GCC 


TCG 


GGT 


TAC 


CGT CGC CGT 


CAA 


CGC 


his his 


arg 


pro 


his 


pro 


thr 


gly thr asp arg ala 


ser 


gly 


tyr 


arg arg arg 


gin 


arg 


301/101 












331/111 








GCT GGA 


CAG 


CAT 


CGG 


TCC 


CCG 


CTG GGT CAA TGC ACT 


CAT 


GCA 


GCG 


CCG CAA CGA 


ACA 


GCT 


ala gly 


gin 


his 


arg 


ser 


pro 


leu gly gin cys thr 


his 


ala 


ala pro gin arg 


thr 


ala 


361/121 












391/131 












CAA CCC 


TTG 


AAC 


CGG 


GTC 


CCG 


GCC TGC CGA CCC TCG 


GCC 


GCC 


GGC 


GTG CCG CTA 


CGT 


GAT 


gin pro 


leu 


asn 


arg 


val 


pro 


ala cys arg pro ser 


ala 


ala 


gly val pro leu 


arg 


asp 


421/141 












451/151 










AGA CAC 


AGG 


GCC 


ATG 


GAA 


ATC 


CTG GCC AGC CGG ATG 


CTA CTT 


CGG 


CCG GCG GAC 


TAT 


CAG 


arg his 
481/161 


arg 


ala 


met 


glu 


ile 


leu ala ser arg met 


leu 


leu 


arg 


pro ala asp 


tyr 


gin 


CGG TCG 


CTG 


AGC 


TTC 


TAC 


CGT 


GAC CAG ATC 














arg ser 


leu 


ser 


phe 


tyr 


arg 


asp gin ile 















SEQ ID N° 11A 



FIGURE 11A 



CCG AAG 


AGG 


TCC 


CCC 


pro lys 


arg 


ser 


pro 


62/21 








AGG CAT 


AAA 


ACC 


TAG 


arg his 


lys 


thr 


AMB 


122/41 








GGG CGT 


GCA 


TTC 


CGA 


gly arg 


ala 


phe 


arg 


182/61 








CGA AGG 


ccG 


AGC 


GAC 


arg arg 


pro 


ser 


asp 


242/81 








ACC ACC 


GCC 


CGC 


ACC 


thr thr 


ala 


arg 


thr 


302/101 








CTG GAC 


AGC 


ATC 


GGT 


leu asp 


ser 


ile 


gly 


362/121 








AAC CCT 


TGA 


ACC 


GGG 


a3n pro 


OPA 


thr 


gly 


422/141 






GAC ACA 


GGG 


CCA 


TGG 


asp thr 


gly 


pro 


trp 


482/161 








GGT CGC 


TGA 


GCT 


TCT 


gly arg 


OPA 


ala 


ser 



GTT TTG TTA ATT TTT 
val leu leu ile phe 

TAC CTG GGG CGG CGG 
tyr leu gly arg arg 

CGA CCC TGT ACG ACC 
arg pro cys thr thr 

GGG CTG CCG GCG CTG 
gly leu pro ala leu 

CGA CCG GTA CGG ATC 
arg pro val arg ile 

CCC CGC TGG GTC AAT 
pro arg trp val asn 

TCC CGG CCT GCC GAC 
ser arg pro ala asp 

AAA TCC TGG CCA GCC 
lys ser trp pro ala 

ACC GTG ACC AGA TC 
thr val thr arg 



32/11 








AAA AAA 


TTT 


GTG 


TCA 


lys lys 


phe 


val 


ser 


92/31 








ATT CAA 


CGA 


AAA 


CCG 


ile gin 


arg 


lys 


pro 


1S2/51 








CGC TGG 


TGG 


CAA 


CGC 


arg trp 


trp 


gin 


arg 


212/71 






ACC GCC 


GCG 


GAA 


GCC 


thr ala 


ala 


glu 


ala 


272/91 








GCG CCT 


CGG 


GTT 


ACC 


ala pro 


arg 


val 


thr 


332/111 






GCA CTC 


ATG 


CAG 


CGC 


ala leu 


met 


gin 


arg 


392/131 






CCT CGG 


CCG 


CCG 


GCG 


pro arg 


pro 


pro 


ala 


452/151 








GGA TGC 


TAC 


TTC 


GCC 


gly cys 


tyr 


phe 


gly 



CAA 
gin 


AGC GGG 
ser gly 


GTA 
val 


CCA 
pro 


AGT 
ser 


GGG GGT 

gly gly 


AGT 
ser 


CAG 
gin 


CGA 
arg 


TGA GTG 
OPA val 


CCC 
arg 


CGA 
arg 


GCC GAG TGG 
ala glu trp 


ATG 
met 


GTC 
val 


GTC 
val 


GCC GTC 
ala val 


ACC 
asn 


GCG 
ala 


CGC AAC GAA 
arg asn glu 


CAG 
gin 


CTC 
leu 


TGC 
cys 


CGC TAC 
arg tyr 


GTG 
val 


ATA 
ile 


CGG 
arg 


CGG ACT 
arg thr 


ATC 
ile 


AGC 
ser 



SEQ ID N° 11B 



FIGURE 11B 
FEU1LLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 ^^T/FR98/01813 



33/185 



CGA AGA GGT CCC CCG 
arg arg gly pro pro 
63/21 

GGC ATA AAA CCT AGT 
gly ile lys pro ser 
123/41 

GGC GTG CAT TCC GAC 
gly val his ser asp 
183/61 

GAA GGC CGA GCG ACG 
glu gly arg ala thr 
243/81 

CCA CCG CCC GCA CCC 
pro pro pro ala pro 
303/101 

TGG, ACA GCA TCG GTC 
trp thr ala ser val 
363/121 

ACC CTT GAA CCG GGT 
thr leu glu pro gly 
423/141 

ACA CAG GGC CAT GGA 
thr gin gly his gly 
483/161 

GTC GCT GAG CTT CTA 
val ala glu leu leu 



TTT 
phe 


TGT 
cys 


TAA 
OCH 


TTT 
phe 


TTA 
leu 


ACC 
thr 


TGG 
trp 


GGC 
gly 


GGC 
gly 


GGA 
gly 


GAC 
asp 


CCT 
pro 


GTA 
val 


CGA 
arg 


CCC 
pro 


GGC 
gly 


TGC 
cys 


CGG 
arg 


CGC 
arg 


TGA 
OPA 


GAC 
asp 


CGG 
arg 


TAC 
tyr 


GGA 
gly 


TCG 
ser 


CCC 
pro 


GCT 
ala 


GGG 
gly 


TCA 
ser 


ATG 
met 


CCC 
pro 


GGC 
gly 


CTG 
leu 


CCG 
pro 


ACC 
thr 


AAT 
asn 


CCT 
pro 


GGC 
gly 


CAG 
gin 


CCG 
pro 


CCG 
pro 


TGA 
OPA 


CCA 
pro 


GAT 
asp 


C 



33/11 

AAA AAT TTG TGT CAC 
lys asn leu cys his 
93/31 

TTC AAC GAA AAC CGA 
phe asn glu asn arg 
153/51 

GCT GGT GGC AAC GCC 
ala gly gly asn ala 
213/71 

CCG CCG CGG AAG CCG 
pro pro arg lys pro 
273/91 

CGC CTC GGG TTA CCG 
arg leu gly leu pro 
333/111 

CAC TCA TGC AGC GCC 
his ser cys ser ala 
393/131 

CTC GGC CGC CGG CGT 
leu gly arg arg arg 
453/151 

GAT GCT ACT TCG GCC 
asp ala thr ser ala 



AAA GCG GGG TAC CAA 
lys ala gly tyr gin 

GTG GGG GTA GTC AGG 
val gly val val arg 

GAT GAG TGC GCC GAC 
asp glu cys ala asp 

CCG AGT GGA TGG TCA 
pro ser gly trp ser 

TCG CCG TCA ACG CGC 
ser pro ser thr arg 

GCA ACG AAC AGC TCA 
ala thr asn ser ser 

GCC GCT ACG TGA TAG 
ala ala thr OPA AMB 

GGC GGA CTA TCA GCG 
gly gly leu ser ala 



SEQ ID N° 11C 
FIGURE 11C 



partie de la sequence nucleotidique de Seqll 
1/1 - 



91/31 
GTC CCC 
val pre 
151/51 
GAA ATC 
glu ile 
211/71 



CGT CGC 


CGT 


CAA 


CGC 


GCT 


GGA 


CAG 


CAT 


CGG 


arg arg 


arg gin 


arg 


ala 


gly 


gin 


his 


arg 


61/21 














CCG CAA 


CGA ACA 


GCT 


CAA 


CCC 


TTG 


AAC 


CGG 


pro gin 


arg 


thr 


ala 


gin 


pro 


leu 


asn 


arg 


121/41 














GTG CCG 


CTA 


CGT 


GAT 


AGA 


CAC 


AGG 


GCC 


ATG 


val pro 


leu 


arg 


asp 


arg 


his 


arg 


ala 


met 


181/61 














CCG GCG 


GAC 


TAT 


CAG 


CGG 


TCG 


CTG 


AGC 


TTC 


pro ala 


asp 


tyr 


gin 


arg 


ser 


leu 


ser 


phe 



CTG 


GGT 


CAA 


TGC ACT 


CAT 


GCA 


GCG 


leu gly gin 


cys 


thr 


his 


ala 


ala 


GCC 


TGC 


CGA 


CCC 


TCG 


GCC 


GCC 


GGC 


ala 


cys 


arg 


pro 


ser 


ala 


ala 


gly 


CTG 


GCC 


AGC 


CGG 


ATG 


CTA 


CTT 


CGG 


leu 


ala 


ser 


arg 


met 


leu 


leu 


arg 



SEQ ID N° HA' 
FIGURE 11A 1 



FEUILLE DE REMPLACEMENT (REGLE 26) 




WO 99/09186 WU/FR98/01813 

34/185 



1/1 31/11 

GTC GCC GTC AAC GCG CTG GAC AGC AIC GGT CCC CGC TGG GTC AAT GCA CTC ATG CAG CGC 
val ala val asn ala leu asp ser ile gly pro arg trp val asn ala leu met gin arg 
61/21 91/31 

CGC AAC GAA CAG CTC AAC CCT TGA ACC GGG TCC CGG CCT GCC GAC CCT CGG CCG CCG GCG 
arg asn glu gin leu asn pro OPA thr gly ser arg pro ala asp pro arg pro pro ala 
121/41 151/51 

TGC CGC TAG GTG ATA GAC ACA GGG CCA TGG AAA TCC TGG CCA GCC GGA TGC TAC TTC GGC 

cys arg tyr val ile asp thr gly pro trp lys ser trp pro ala gly cys tyr phe gly 

181/61 211/71 

CGG CGG ACT ATC AGC GGT CGC TGA GCT TCT ACC GTG ACC AGA TC 

arg arg thr ile ser gly arg OPA ala ser thr val thr arg 



SEQ ID N° 11B' 



FIGURE 11B' 



1/1 

TCG CCG TCA ACG CGC TGG ACA GCA TCG GTC 
ser pro ser thr arg trp thr ala ser val 
61/21 

GCA ACG AAC AGC TCA ACC CTT GAA CCG GGT 
ala thr asn ser ser thr leu glu pro gly 
121/41 

GCC GCT ACG TGA TAG ACA CAG GGC CAT GGA 
ala ala thr OPA AMB thr gin gly his gly 
181/61 

GGC GGA CTA TCA GCG GTC GCT GAG CTT CTA 
gly gly leu ser ala val ala glu leu leu 



SEQ 



31/11 












CCC GCT 


GGG 


TCA ATG 


CAC TCA TGC 


AGC 


GCC 


pro ala 


gly 


ser met 


his ser cys 


ser 


ala 


91/31 










CCC GGC 


CTG 


CCG ACC 


CTC GGC CGC 


CGG 


CGT 


pro gly 


leu 


pro thr 


leu gly arg 


arg 


arg 


151/51 








AAT CCT 


GGC 


CAG CCG 


GAT GCT ACT 


TCG 


GCC 


asn pro 


gly 


gin pro 


asp ala thr 


ser 


ala 


211/71 










CCG TGA 


CCA 


GAT C 








pro OPA 


pro 


asp 









ID N° 11C 



FIGURE 11C 



sequence Rv0546c predite par par Cole et al. (Nature 393:537-544) et contenant SeqllA' 



1/1 


















31/11 


















atg gaa 
Met glu 
61/21 


ate 
ile 


ctg 
leu 


gcc 
ala 


age 
ser 


egg 
arg 


atg 
met 


eta 
leu 


ctt 
leu 


egg ccg 
arg pro 
91/31 


gcg 
ala 


gac 
asp 


tat 
tyr 


cag 
gin 


egg 
arg 


teg 
ser 


ctg 
leu 


age 
ser 


ttc tac 
phe tyr 
121/41 


cgt 
arg 


gac 
asp 


cag 
gin 


ate 
ile 


ggg 

gly 


ctg 
leu 


gcg 
ala 


att 
ile 


gcc cgt 
ala arg 
151/51 


gaa 
glu 


tac 
tyr 


ggg 

gly 


gcc 
ala 


ggc 
gly 


aca 
thr 


gtg 
val 


ttt 
phe 


ttc gcc 
phe ala 
131/61 


ggt 
gly 


cag 
gin 


tea 
ser 


ctg 
leu 


etc 
leu 


gaa 
glu 


ctg 
leu 


gcc 
ala 


ggt tac 
gly tyr 
211/71 


ggc 
gly 


gag 
glu 


ccg 
pro 


gac 
asp 


cat 
his 


teg 
ser 


egg 
arg 


gga 
gly 


cct ttt 
pro phe 
241/81 


ccc 
pro 


ggc 
gly 


gcg 
ala 


ctg 
leu 


tgg 
trp 


ctg 
leu 


cag 
gin 


gtg 
val 


cgc gac 
arg asp 
271/91 


etc 
leu 


gag 
glu 


get 
ala 


acc 
thr 


cag 
gin 


acc 
thr 


gag 
glu 


ctg 
leu 


gtc age 
val ser 
301/101 


cga 
arg 


ggc 
gly 


gtg 

val 


teg 
ser 


ate 
ile 


get 
ala 


cgc 
arg 


gag 
glu 


ccc cgc 
pro arg 
331/111 


cgc 
arg 


gaa 
glu 


ccg 
pro 


tgg 
trp 


ggc 

gly 


ctg 
leu 


cac 
his 


gag 
glu 


atg cat 
met his 
361/121 


gtg 
val 


acc 
thr 


gac 
asp 


cca 
pro 


gac 
asp 


ggg 

gly 


ate 
ile 


aca 
thr 


ctg ata 
leu ile 


ttc 
phe 


gtc 
val 


gag 
glu 


get 
val 


ccc 
pro 


gag 

glu 


ggt 
gly 


cac 
his 


ccg ctg 
pro leu 


cgt 
arg 


aca 
thr 


gac 
asp 


acc 
thr 


egg 
arg 


gcg 
ala 


tga 
OPA 























SEQ ID N° 11D 



FEUILLE DE REM&to&eBMEMrrfREGLE 26) 





WO 99/09186 PCI7FR98/01813 



35/185 



ORF predite par par Cole et al . (Nature 393:537-544) et contenant Rv0546c 
1/1 31/11 

tag tea ggg cgt gca ttc gac gac get gta eta ccc get ggt ggc aac tec gat gat tgc 
AMB ser gly arg ala phe asp asp ala val leu pro ala gly gly asn ser asp asp cvs 
61/21 91/3X 

gee gac gaa ggc eta cga egg get gee ggc get gac cgc cgc gga age cgc cga gtg gat 
ala asp glu gly leu arg arg ala ala gly ala asp arg arg gly ser arg arg val asp 
121/41 151/51 * 

ggt cac cgc cgc ccg cac ccg ace ggt gcg gat cgc gee teg ggt tgc cgt cgc cgt caa 
gly his arg arg pro his pro thr gly ala asp arg ala ser gly cy 5 arg arg arg gin 
181/61 211/71 

cgc get gga cag cat egg tec ccg ctg ggt caa tgc act cat gca gcg ccg caa cga aca 

o^?/o^ a 9ly 9ln hiS ar9 Ser pr ° leU gly gln cys thr his ala aXa P ro arg thr 
241/81 271/91 

get caa ccc ttg aac egg gtc ccg gec tgc cga ccc teg gee gec ggc gtg ccg eta cgt 

™? ,?i n Pr ° lGU asn arg val pro ala cys arg P ro ser ala ala val pro leu arq 
301/101 331/111 * 

gat aga cac agg gee atg gaa ate ctg gee age egg atg eta ctt egg ccg gcg gac tat 

ala mSt glu ±le leU ala ser arg met leu leu ar 9 Pro ala asp tyr 
361/121 391/131 " 

cag egg teg ctg age ttc tac cgt gac cag ate ggg ctg gcg att gee cgt gaa tac gqa 

SCr leU Ser Phe tyr arg asp gln ile gl y leu ala iie a * a a ^g glu tyr gly 
421/141 451/151 

gee ggc aca gtg ttt ttc gee ggt cag tea ctg etc gaa ctg gee ggt tac ggc gag ccg 

a * a ,^ y val phe phe ala gly gln ser leu leu g iu leu a * a giy tyr g i y g i u pr o 

481/161 511/171 

gac cat teg egg gga cct ttt ccc ggc gcg ctg tgg ctg cag gtg cgc gac etc gag get 

a !?/^ arg gly Pr ° Phe Pr ° gly ala leu tr P ieu g ln val ar g a sp leu glu ala 

541/181 571/191 

acc cag acc gag ctg gtc age cga ggc gtg teg ate get cgc gag ccc cgc cgc gaa ccg 

*nf 9 U leU Val ser arg gly val ser iie ala arg glu pro arg arg glu pro 

601/201 631/211 

tgg ggc ctg cac gag atg cat gtg acc gac cca gac ggg ate aca ctg ata ttc gtc oaa 

h±S 9lU ^ hiS Val thC aSP Pr ° aSp gly ile thr leu ile val glu 
661/221 691/231 

gtt ccc gag ggt cac ccg ctg cgt aca gac acc egg gcg tga 

val pro glu gly his pro leu arg thr asp thr arg ala OPA 



SEQ ID N° 11F 
FIGURE 11F 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/0W86 



PCT/FR98/01813 



36/185 



VI 31/11 

gac cga agg gat ttc gcg act aac teg gcc tgt aag gca acg cga ggt ctt cat gcc gag 

asp arg arg asp phe ala thr asn ser ala cys lys ala thr arg gly leu his ala glu 
61/21 91/31 

gac gta gac agg aag aga cag gga age tga tga cgt cgc gta ccg gac cgc cat tct gtc 

asp val asp arg lys arg gin gly ser OPA OPA arg arg val pro asp are his ser val 
121/41 151/51 

gag tct ttc cga gtt cag caa caa teg aca cag aag egg gga cca gac egg gag gac gac 

glu ser phe arg val gin gin gin ser thr gin lys arg gly pro asp arg glu asp asp 
181/61 211/71 

gcg gcc egg gcc get teg ggc cga gtg tct gag taa gac cag agt cac ggg tec gtg tgt 

ala ala arg ala ala ser gly arg val ser glu OCH asp gin ser his gly ser val cys 
241/81 271/91 

gac aac cgc gcg gaa ttc aat egg atg gcg ggc ggg acc gga ttg cgc egg tea ccg agg 

301/101 Pr ° arg 

aac etc egg agt gat c 

asn leu arg ser asp 



SEQ ID N° 12A 



FIGURE 12A 



1/1 

acc gaa ggg att teg 

thr glu gly ile ser 
61/21 

acg tag aca gga aga 

thr AMB thr gly arg 
121/41 

agt ctt tec gag ttc 

ser leu ser glu phe 
181/61 

egg ccc ggg ccg ctt 

arg pro gly pro leu 
241/81 

aca acc gcg egg aat 

thr thr ala arg asn 
301/101 

acc tec gga gtg ate 

thr ser gly val ile 



cga eta act egg cct 
arg leu thr arg pro 

gac agg gaa get gat 
asp arg glu ala asp 

age aac aat cga cac 
ser asn asn arg his 

egg gcc gag tgt ctg 
arg ala glu cys leu 

tea ate gga tgg egg 
ser ile gly trp arg 



31/11 








gta agg 


caa 


cgc 


gag 


val arg 


gin 


arg glu 


91/31 








gac gtc 


gcg 


tac 


egg 


asp val 


ala 


tyr 


arg 


151/51 






aga age 


ggg 


gac 


cag 


arg ser 


gly 


asp gin 


211/71 








agt aag 


acc 


aga 


gtc 


ser lys 


thr 


arg 


val 


271/91 






gcg gga 


ccg 


gat 


tgc 


ala gly 


pro 


asp 


cys 



gtc 

val 


ttc 
phe 


atg 
met 


ccg agg 
pro arg 


acc 
thr 


gcc 
ala 


att 
ile 


ctg teg 
leu ser 


acc 
thr 


ggg 

gly 


agg 
arg 


acg acg 
thr thr 


acg 
thr 


ggt 
gly 


ccg 
pro 


tgt gtg 
cys val 


gcc 
ala 


ggt 
gly 


cac 
his 


cga gga 
arg gly 



SEQ ID N° 12B 



FIGURE 12B 



FEUiLLE DE REMPLACEMENT (REGLE 26) 




WO 99/09186 ^Rt/FR98/01813 



37/185 

1/1 31/11 
ccg aag gga ttt cgc gac taa etc ggc ctg taa ggc aac gcg agg tct tea tgc cga gga 
pro lys gly phe arg asp OCH leu gly leu OCH gly asn ala arg ser ser cys arg gly 
61/21 91/3X 

cgt aga cag gaa gag aca ggg aag ctg atg acg teg cgt ace gga ccg cca ttc tot cga 

ff?^f g gln glU glU thr gly lys leu met thr 3er ar * the gly pro pro phe cys arg 
121/41 151/51 

gtc ttt ccg agt tea gca aca ate gac aca gaa gcg ggg ace aga ccg gga gga cga cgc 
yal phe pro ser ser ala thr ile asp thr glu ala gly thr arg pro gly gly arg arg 
181/61 211/71 

ggc ccg ggc cgc ttc ggg ccg agt gtc tga gta aga cca gag tea egg gtc cgt gtg tga 

?i3f/Sf° g y arg PhS 9ly Pr ° Ser Val 0PA Val arg P ro glu ser **<3 val arg val OPA 

241/81 271/91 

caa ccg cgc gga att caa teg gat ggc ggg egg gac egg att gcg ccg gtc ace gag gaa 

301/101 ^ " P Ue 3la Pr ° Val thr glu glu 



301/101 
cct ccg gag tga tc 
pro pro glu OPA 



SEQ ID N° 12C 
FIGURE 12C 



1/1 31/U 

GGG ATT TCG TTG CCC GAT GGA TTG TTT GTA CGG TTT GGG AAA AAC ACT TGA AGT CCT TTT 
gly lie ser leu pro asp gly leu phe val arg phe gly lys asn thr OPA ser pro phe 
61/21 91/31 

TAT TGG CAA TGC TGG AAA TGG ACA TTC CAA TAT TGC GCG AAT TAA CCG AAC ACG GTG AGG 

??f 9 CyS trP lyS trp thr phe gXn tyr cys ala asn ^ P ro as " thr val arg 
12i/41 151/51 

GGG GGG CAA GCG TTT GTA CCG GGG CCA GCA AGC GCC GCC GAC CGG TTG ACC GAA GCC AGC 

?i?,?, y 9 ala Phe Val pr ° gly pro ala ser ala ala as P a *9 thr glu ala se- 
181/61 211/71 

ATGVTTG TTG TGT CAG CGC GGG CTT GGT CTC GAT GTC CCG GCC TTG GCT GGA CCC GCT TCT 
met leu leu cys gln arg gly leu gly leu asp val pro ala leu ala gly pro ala ser 
241/81 271/91 

TCA AAA CAG GTT GAA CTT AAC GAC TCA AGA ACG GAA ACG CTT GAA CCG CGA CGT CGC TCC 

gln Val glU l6U asn a5p ser arg thr glu thr leu 9 iu P ro a ^ a ^g arg se- 
301/101 331/111 " " 

GGA CAC CAA TTT GAC TCG GCT CTT TGG CAA TTG AAG GTG AGC TGC GAG CAG CCG GGT GAC 

9 P 3SP 36r ala leU trp gln leu lys val ser C V S 9lu gln pro gly aso 
361/121 391/131 * 

CGC ATC GTT GGC CTT GCC ATC AAT CGC CGG CTC GCG GAC GTA GAT AAT CAG CTC ACC GTT 

9ly leU ala ile d3n arg arg leu ala a3 P val as P asn gln leu thr val 
421/141 451/151 

GGG ACC GAC CTC GAC CAG GGG TCC TTT GTG ACT GCC GGG CTT GAC GCG GAC GAC CAC AGA 

?«/^f 35P a3P gln gly S6r Phe Val thr ala gly leu a3 P aia as P a 30 his are 
481/161 511/171 

GTC GGT CAT CGC CTA AGG CTA CCG TTC TGA CCT GGG GCT GCG TGG GCG CCG ACG ACG TGA 

arg leU arg leU pro phe 0PA pro gly ala aia C *P aia P^ thr thr OPA 
541/181 571/191 

GGC ACG TCA TGT CTC AGC GGC CCA CCG CCA CCT CGG TCG CCG GCA GTA TGT CAG CAT GTG 
601/201 ^ ^ Pr ° PC ° Pr ° HI/HI Pr ° dla Val CyS gla his val 

CAG ATG ACT CCA CGC AGC CTT GTT CGC ATC GTT GGT GTC GTG GTT GCG ACG ACC TTG GCG 

f*,™* thr Pr ° arg ser leu val arg ile vaX v *l val val ala thr thr leu ala 

661/221 691/231 

CTG GTG AGC GCA CCC GCC GGC GGT CGT GCC GCG CAT GCG GAT C 

leu val ser ala pro ala gly gly arg ala ala his ala asp 

SEQ ID N° 13A 



FIGURE 13A 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 




T/FR98/01813 



38/185 



32/11 



GGA TTT 


CGT 


TGC 


CCG 


ATG 


GAT 


TGT TTG TAC GGT TTG 


GGA AAA AGA 


CTT 


GAA 


GTC 


CTT 


TTT 


gly phe 


arg 


cys 


pro 


met 


asp 


cys leu tyr gly leu gly lys thr 


leu 


olu 


val 


leu 


phe 


62/21 












92/31 










ATT GGC 


AAT 


GCT 


GGA AAT 


GGA 


CAT TCC AAT ATT GCG 


CGA ATT AAC 


CGA 


ACA 


CGG 




CZtZfZ 


ile gly 


asn 


ala 


gly 


asn 


gly 


his ser asn ile ala 


ara i le asn 


arg 


thr 


arg 


Win 


gly 


122/41 












152/51 








GGG GGC 


AAG 


CGT 


TTG 


TAC 


CGG 


GGC CAG CAA GCG CCG 


CCG ACC GGT 


TGA 


CCG 




era 




gly gly 


lys 


arg 


leu 


tyr 


arg 


gly gin gin ala pro 


pro thr gly 


OPA 


pro 


Ivs 


pro 


aid 


182/61 












212/71 








TGT TGT 


TGT 


GTC 


AGC 


GCG 


GGC 


TTG GTC TCG ATG TCC 


CGG CCT TGG 


CTG 


GAC 


CCG 


CTT 




cys cys 


cys 


val 


ser 


ala gly 


leu val ser met ser 


arg pro trp 


leu 


asp 






leu 


242/81 












272/91 










CAA AAC 


AGG 


TTG 


AAC 


TTA ACG 


ACT CAA GAA CGG AAA 


CGC TTG AAC 


CGC 


GAC 




GCT 




gin asri 


arg 


leu 


asn 


leu 


thr 


thr gin glu arg lys 


arg leu asn 


arg 


asp 


val 


ala 


pro 


302/101 












332/111 








GAC ACC 


AAT 


TTG 


ACT 


CGG 


CTC 


TTT GGC AAT TGA AGG 


TGA GCT GCG 


AGC 


AGC 


CGG 


GTG 




asp thr 


asn 


leu 


thr 


arg 


leu 


phe gly asn OPA arg 


OPA ala ala 


ser 


ser 


arg 


val 


thr 


362/121 












392/131 












GCA TCG 


TTG 


GCC 


TTG 


CCA 


TCA 


ATC GCC GGC TCG CGG 


ACG TAG ATA 


ATC 


AGC 


TCA 


CCG 


TTfZ 
J. lu 


ala ser 


leu 


ala 


leu 


pro 


ser 


ile ala gly ser arg 


thr AM3 ile 


ile 


ser 


ser 


pro 


1 *»1t 
1CU 


422/141 












452/151 












GGA CCG 


ACC 


TCG 


ACC AGG 


GGT 


CCT TTG TGA CTG CCG 


GGC TTG ACG 


CGG 


ACG 


ACC 


ACA 


GAG 


gly pro 


thr 


ser 


thr arg gly 


pro leu OPA leu pro gly leu thr 


arg 


thr 


thr 


thr 


glu 


482/161 












512/171 










TCG GTC 


ATC 


GCC 


TAA 


GGC 


TAC 


CGT TCT GAC CTG GGG 


CTG CGT GGG 


CGC 


CGA 


CGA 


CGT 


GAG 


ser val 


ile 


ala 


OCH 


gly tyr 


arg ser asp leu gly leu arg gly 


arg 


arg 


arg 


arg 


glu 


542/181 












572/191 






GCA CGT 


CAT 


GTC 


TCA 


GCG 


GCC 


CAC CGC CAC CTC GGT 


CGC CGG CAG 


TAT 


GTC 


AGC 


ATG 


TGC 


ala arg 


his 


val 


ser 


ala 


ala 


his arg his leu gly arg arg gin 


tyr 


val 


ser 


met 


cys 


602/201 












632/211 










AGA TGA 


CTC 


CAC 


GCA 


GCC 


TTG 


TTC GCA TCG TTG GTG 


TCG TGG TTG 


CGA 


CGA 


CCT 


TGG 


CGC 


arg OPA 


leu 


his 


ala 


ala 


leu 


phe ala ser leu val 


ser trp leu 


arg 


arg 


pro 


trp 


arg 


662/221 












692/231 




TGG TGA 


GCG 


CAC 


CCG 


CCG 


GCG 


GTC GTG CCG CGC ATG 


CGG ATC 












trp OPA 


ala 


his 


pro 


pro 


ala 


val val pro arg met 


arg ile 













SEQ ID N° 13B 
FIGURE 13B 



FEUILLE DE REMPLACEMENT (REGLE 26) 




WO 99/09186 ^CT/FR98/01813 



39/185 





















33/11 


















GAT TTC 


GTT 


GCC 


CGA 


TGG 


ATT 


GTT 


TGT 


ACG 


GTT TGG 


GAA AAA 


CAC 


TTG 


AAG 


TCC 


TTT 


TTA 
X x*\ 


asp phe 


val 


ala 


arg 


trp 


ile 


val 


cys 


thr 


val trp glu lys 


his 


leu 


lvs 


ser 




leu 


63/21 


















93/31 














TTG GCA 


ATG 


CTG 


GAA 


ATG 


GAC ATT 


CCA ATA 


TTG CGC 


GAA TTA ACC 


GAA 


CAC 


GGT 


GAG 




leu ala 


met 


leu 


glu 


met 


asp 


ile 


pro ile 


leu arg glu leu thr 


glu 


his 


civ 


glu 


crlv 


123/41 


















153/51 












GGG GCA 


AGC 


GTT 


TGT 


ACC 


GGG 


GCC 


AGC AAG 


CGC CGC 


CGA CCG 


GTT 


GAC 


CGA 


AGC 


CAG 


CAT 


gly ala 


ser 


val 


cys 


thr gly ala 


ser 


lys 


arg arg 


arg pro 


val 


asp 


arc 

**** 3 


ser 


crln 


his 


183/61 


















213/71 












GTT GTT 


GTG 


TCA 


GCG 


CGG 


GCT 


TGG 


TCT 


CGA 


TGT CCC 


GGC 


CTT 


GGC 


TGG 


ACC 


CGC 


X IV> 




val val 


val 


ser 


ala 


arg 


ala 


trp 


ser 


arg 


cys pro gly leu gly 


trp 


thr 


arg 


flic 




243/81 


















273/91 










AAA ACA 


GGT 


TGA 


ACT 


TAA 


CGA 


CTC 


AAG 


AAC 


GGA AAC 


GCT 


TGA 


ACC 


CCC 


apc 








lys thr 


gly 


OPA 


thr 


OCH 


arg 


leu 


lys 


asn 


gly asn 


ala 


OPA 


thr 




thr 


ser 


leu 


arg 


303/101 


















333/111 














ACA CCA 


ATT 


TGA 


CTC 


GGC 


TCT 


TTG 


GCA ATT 


GAA GGT 


GAG 


CTG 


CGA 


GCA 


GCC 


ccc 


TfZTX 
X un. 




thr pro 


ile 


OPA 


leu 


gly ser leu 


ala 


ile 


glu gly glu 


leu 


arg 


ala 


ala 


crlv 
y x jr 


OPA 


pro 


363/121 


















393/131 














CAT CGT 


TGG 


CCT 


TGC 


CAT 


CAA 


TCG 


CCG 


GCT 


CGC GGA 


CGT 


AGA 


TAA 


TCA 


GCT 


CAC 


CGT 


X VJV? 


his arg 


trp 


pro 


cys 


his 


gin 


ser 


pro 


ala 


arg gly 


arg 


arg 


OCH 


ser 


ala 


hi *? 


a rg 




423/141 


















453/151 














GAC.CGA 


CCT 


CGA 


CCA 


GGG 


GTC 


CTT 


TGT 


GAC 


TGC CGG 


GCT 


TGA 


CGC 


GGA 


CGA 


CCA 


CAG 


AGT 


asp arg 


pro 


arg 


pro 


gly val leu 


cys 


asp 


cys arg 


ala 


OPA 


arg 


gly 


arg 


pro 


gin 


ser 


483/161 


















513/171 








CGG TCA 


TCG 


CCT 


AAG 


GCT 


ACC 


GTT 


CTG ACC 


TGG GGC 


TGC 


GTG 


GGC 


GCC 


GAC 


GAC 


GTG 


AGG 


arg ser 


ser 


pro 


lys 


ala 


thr 


val 


leu 


thr 


trp gly 


cys 


val 


gly 


ala 


asp 


asp 


val 


arg 


543/181 


















573/191 












CAC GTC 


ATG 


TCT 


CAG 


CGG 


CCC 


ACC 


GCC 


ACC 


TCG GTC 


GCC 


GGC 


AGT 


ATG 


TCA 


GCA 


TGT 


GCA 


his val 


met 


ser 


gin 


arg 


pro 


thr 


ala 


thr 


ser val 


ala gly 


ser 


met 


ser 


ala 


cys 


ala 


603/201 


















633/211 
















GAT GAC 


TCC 


-ACG 


CAG 


CCT 


TGT 


TCG 


CAT 


CGT 


TGG TGT 


CGT 


GGT 


TGC 


GAC 


GAC 


CTT 


GGC 


GCT 


asp asp 


ser 


thr 


gin 


pro 


cys 


ser 


his 


arg 


trp cys 


arg gly cys 


asp 


asp 


leu 


gly 


ala 


663/221 


















693/231 












GGT GAG 


CGC 


ACC 


CGC 


CGG 


CGG 


TCG 


TGC 


CGC 


GCA TGC 


GGA TC 














gly glu 


arg 


thr 


arg 


arg 


arg 


ser 


cys 


arg 


ala cys gly 

















SEQ ID N° 13C 
FIGURE 13C 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



40/185 

partie de la sequence nucleotidique de seql3A 
1/1 * 31/11 

GGG TCC TTT GTG ACT GCC GGG CTT GAC GCG GAC GAC CAC AGA GTC GGT CAT CGC CTA AGG 
gly ser phe val thr ala gly leu asp ala asp asp his arg val gly his arg leu arg 
61/21 91/31 

CTA CCG TTC TGA CCT GGG GCT GCG TGG GCG CCG ACG ACG TGA GGC ACG TCA TGT CTC AGC 
leu pro phe CPA pro gly ala ala trp ala pro thr thr OPA gly thr ser cys leu ser 
121/41 151/S1 

GGC CCA CCG CCA CCT CGG TCG CCG GCA GTA TGT CAG CAT GTG CAG ATG ACT CCA CGC AGC 
gly pro pro pro pro arg ser pro ala val cys gin his val gin met thr pro arg ser 
1SX/61 211/71 

CTT GTT CGC ATC GTT GGT GTC GTG GTT GCG ACG ACC TTG GCG CTG GTG AGC GCA CCC GCC 
leu val arg ile val gly val val val ala thr thr leu ala leu val ser ala pro ala 
241/81 c 
GGC GGT CGT GCC GCG CAT GCG GAT C 
gly gly arg ala ala his ala asp 



SEQ ID N° 13A' 
FIGURE 13A« 



1/1 31/11 

GGT CCT TTG TGA CTG CCG GGC TTG ACG CGG ACG ACC ACA GAG TCG GTC ATC GCC TAA GGC 
gly pro leu OPA leu pro gly leu thr arg thr thr thr glu ser val ile ala OCH alv 
61/21 91/31 

TAC CGT TCT GAC CTG GGG CTG CGT GGG CGC CGA CGA CGT GAG GCA CGT CAT GTC TCA GCG 
tyr arg ser asp leu gly leu arg gly arg arg arg arg glu ala arg his val ser ala 
121/41 151/51 

GCC CAC CGC CAC CTC GGT CGC CGG CAG TAT GTC AGC ATG TGC AGA TGA CTC CAC GCA GCC 
ala his arg his leu gly arg arg gin tyr val ser met cys arg OPA leu his ala ala 
181/^1 211/71 

TTG TTC GCA TCG TTG GTG TCG TGG TTG CGA CGA CCT TGG CGC TGG TGA GCG CAC CCG CCG 
leu phe ala ser leu val ser trp leu arg arg pro trp arg trp OPA ala his pro pro 
241/81 

GCG GTC GTG CCG CGC ATG CGG ATC 
ala val val pro arg met arg ile 



SEQ ID N° 13B' 
FIGURE 13B' 



1/1 31/U 

GTC CTT TGT GAC TGC CGG GCT TGA CGC GGA CGA CCA CAG AGT CGG TCA TCG CCT AAG GCT 

val leu cys asp cys arg ala OPA arg gly arg pro gin ser arg ser ser pro lys ala 

61/21 91/3 1 

ACC GTT CTG ACC TGG GGC TGC GTG GGC GCC GAC GAC GTG AGG CAC GTC ATG TCT CAG CGG 

thr val leu thr trp gly cys val gly ala asp asp val arg his val met ser gin arg 

121/41 151/51 

CCC ACC GCC ACC TCG GTC GCC GGC AGT ATG TCA GCA TGT GCA GAT GAC TCC ACG CAG CCT 

?f?,« r alS thr Ser Val ala gly ser met ser aia c * s aia a5 P as P se * thr gin pro 
181/61 211/71 

TGT TCG CAT CGT TGG TGT CGT GGT TGC GAC GAC CTT GGC GCT GGT GAG CGC ACC CGC CGG 

241/81* ^ ^ gly 9lU thr arg arS 

CGG TCG TGC CGC GCA TGC GGA TC 
arg ser cys arg ala cys gly 



SEQ ID N° 13C 
FIGURE 13C 1 
FEUILLE DE REMPLACEMENT (REGLE 26) 




WO 99/09186 W PCT/FR98/01813 



41/185 



sequence Rvl984c predite par Cole et al. (Nature 393:537-544) et contenant 

VI 31/11 
atg act cca cgc age ctt gtt cgc ate gtt ggt gtc gtg 
Met thr pro arg ser leu val arg ile val gly val val 
61/21 91/31 
gtg age gca ccc gec ggc ggt cgt gee gcg cat gcg gat ccg 
val ser ala pro ala gly gly arg ala ala his ala asp 
121 ' 41 151/51 
gtt ttc get cgc ggc acg cat cag get tct ggt ctt ggc 
val phe ala arg gly thr his gin ala ser gly leu gly 
181/61 211/71 
gac teg ctt ace teg caa gtt ggc ggg egg teg att ggg 
asp ser leu thr ser gin val gly gly arg ser ile gly 
241/81 271/91 
gca age gac gac tac cgc gcg age gcg tea aac ggt tec 
ala ser asp asp tyr arg ala ser ala ser asn gly ser 
301/101 331/111 
cag cgc ace gtc gee age tgc ccg aac ace agg att gtg 
gin arg thr val ala ser cys pro asn thr arg ile val 
361/121 391/131 
gcg acg gtc ate gat ttg tec ace teg gcg atg ccg ccc 
ala thr val ile asp leu ser thr ser ala met pro pro 
421/141 451/151 
get gtc gee ctt ttc ggc gag cca tec agt ggt ttc tec 
ala val ala leu phe gly glu pro ser ser gly phe ser 
481/T61 m 511/171 

teg ttg ccg aca ate ggt ccg ctg tat age tct aag ace 
ser leu- pro thr ile gly pro leu tyr ser ser lys thr 
541/181 571/191 
gat cca ata tgc ace gga ggc ggc aat att atg gcg cat 
asp pro ile cys thr gly gly gly asn ile met ala his 
601/201 631/2n 
atg aca age cag gcg gcg aca ttc gcg gcg aac agg etc gat cac 
met thr ser gin ala ala thr phe ala ala asn arg ] 



gtt 
val 


gcg 
ala 


acg ace ttg gcg 
thr thr leu ala 


ctg 
leu 


ccg 
pro 


tgt 
cys 


teg gac ate gcg 
ser asp ile ala 


gtc 
val 


gac 
asp 


gtc 
val 


ggt gag gcg ttc 
gly glu ala phe 


gtc 
val 


gtc 
val 


tac 
tyr 


gcg gtg aac tac 
ala val asn tyr 


cca 
pro 


gat 
asp 


gat 
asp 


gcg age gec cac 
ala ser ala his 


ate 
ile 


ctt ggt 
leu gly 


ggc tat teg cag 
gly tyr ser gin 


ggt 
gly 


gcg gtg 
ala val 


gca gat cat gtc 
ala asp his val 


gec 
ala 


age atg 
ser met 


ttg tgg ggc ggc 
leu trp gly gly 


ggg 

gly 


ata 
ile 


aac 
asn 


ttg tgt get ccc 
leu cys ala pro 


gac 
asp 


gtt 

val 


teg 
ser 


tat gtt cag teg 
tyr val gin ser 


ggg 

gly 


gat 
asp 


cac 
his 


gec gga tga 
ala gly OPA 





SEQ ID N° 13D 
FIGURE 13D 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 




Seol3F» 


ORF 


predite 


par 


1/ 1 










\* y a y y v«- 


acg 


tea 


tgt 


etc 


OPA alv 


thr 


ser 


cys 


leu 


61/21 










y v- y vciy 


a tg 


act 


cca 


cgc 


val 9* In 


met 


thr 


pro 


arg 


ipi /4i 

X£ 1/ 11 










oca ctcf 




age 


gca 


ccc 


ala. leu 

W>-&iO *V^14 


val 


ser 


ala 


pro 


1 ft1 /61 

101/ ox 








erect rtt" r* 


gtt 


ttc 


get 


cgc 


ala val 


val 


phe 


ala 


arg 


fi X/ O JL 








I* V* y L* V* 




teg 


ctt 


ace 


phe val 


asp 


ser 


leu 


thr 


301/101 










tac cca 


gca 


age 


gac 


gac 


tvr Dro 


ala 


ser 


asp 


a sp 


361/121 










cac ate 




cgc 


acc 


gtc 


his ile 


gin 


arg 


thr 


val 

vox 


421/141 








cag ggt 


gcg 


acg 


gtc 


ate 


gin gly 


ala 


thr 


val 


ile 


481/161 










gtc gec 


get 


gtc 


gec 


ctt 


val ala 


ala 


val 


ala 


leu 


541/181 










ggc ggg 


teg 


ttg 


ccg 


aca 


gly gly 


ser 


leu 


pro 


thr 


601/201 










ccc gac 


gat 


cca 


ata 


tgc 


pro asp 


asp 


pro 


ile 


cys 


661/221 








teg ggg 


atg 


aca 


age 


cag 


ser gly 


met 


thr 


ser 


gin 



42/185 



Cole et al. (Nature 393:537 











31/11 




age 


ggc 


cca 


ccg 


cca cct 


egg 


ser 


gly 


pro 


pro 


pro pro 


arg 










31/ ji 




age 


— 4- f- 


gtt 


cgc 


ate gtt 


ggt 


ser 


leu 


vai 


arg 


ile val 


gly 










1 CI /CI 

131/ OL 




gee 


ggc 


ggt 


cgt 


gec gcg 


cat 


ala 
aid 


gly 


gly 


arg 


ala ala 


nis 










£11/71 




ggc 


acg 


cat 


cag 


get tct 


ggt 


gly 


tnr 


nis 


gin 


ala ser 


gly 










Z /1/91 




teg 


caa 


gtt 


ggc 


ggg egg 


teg 


ser 


gin 


Val 


gly 


gly arg 


ser 










OH /111 

Jol/lli 




uac 


cgc 


gcg 


age 


gcg tea 


aae 


Y \i r 

tyr 


ax y 


aid 


ser 


ala ser 


asn 










^yi/ ui 




y 


age 




ccg 


aae acc 


agg 


ala 


ser 


cys 


pro 


asn thr 


arg 










451/151 


gat 


ttg 


tec 


acc 


teg gcg 


atg 


asp 


leu 


ser 


thr 


ser ala 


met 










511/171 




ttc 


ggc 


gag 


cca 


tec agt 


ggt 


phe 


gly 


glu 


pro 


ser ser 


gly 










571/191 




ate 


ggt 


ccg 


ctg 


tat age 


tct 


ile 


gly 


pro 


leu 


tyr ser 


ser 










631/211 




acc 


gga 


ggc 


ggc 


aat att 


atg 


thr 


gly 


gly 


gly 


asn ile 


met 










691/231 




gcg 


gcg 


aca 


ttc 


gcg gcg 


aae 


ala 


ala 


thr 


phe 


ala ala 


asn 



SEQ ID N° 13F 
FIGURE 13F 




PCT/FR98/01813 



544) et contenant Rvl984c 



teg 
ser 


ccg gca 
pro ala 


gta 
val 


tgt 
cys 


cag 
gin 


cat 
his 


gtc gtg gtt 
val val val 


gcg 
ala 


acg 
thr 


acc 
thr 


ttg 

leu 


gcg 
ala 


gat ccg 
asp pro 


tgt 
cys 


teg 
ser 


gac 
asp 


ate 
ile 


ctt ggc gac 
leu gly asp 


gtc 
val 


ggt 
gly 


gag 
glu 


gcg 
ala 


att ggg gtc 
ile gly val 


tac 
tyr 


gcg 
ala 


gtg 
val 


aae 
asn 


ggt tec gat 
gly ser asp 


gat 
asp 


gcg 
ala 


age 
ser 


gee 
ala 


att 
ile 


gtg ctt 
val leu 


ggt 
gly 


ggc 
gly 


tat 
tyr 


teg 
ser 


ccg 
pro 


ccc gcg 
pro ala 


gtg 
val 


gca 
ala 


gat 
asp 


cat 
his 


ttc 
phe 


tec age 
ser ser 


atg 
met 


ttg 
leu 


tgg 
trp 


ggc 
gly 


aag acc ata 
lys thr ile 


aae 
asn 


ttg 
leu 


tgt 

cys 


get 
ala 


gcg 
ala 


cat gtt 
his val 


teg 
ser 


tat 
tyr 


gtt 
val 


cag 
gin 


agg 
arg 


etc gat 
leu asp 


cac 
his 


gee 
ala 


gga 
gly 


tga 
OPA 



FEUILLE DE REMPLACEMENT (REGLE 26) 




WO 99/09186 ^CT/FR98/01813 

43/185 



61/21 
GCG GCT 
ala ala 
121/41 
GTA GCG 
val ala 
181/61 
GAC GGG 
asp gly 
241/81 
TTA CGA 
leu arg 
301/101 





31/11 












GCC 


GAA CGC CGT 


CGG CCA ACT 


TGG 


CCG 


CTG AGG 


ala 


crlu arcr ara 


arg 


pro thr 


urp 


pro 


leu arg 




91/31 










GCA 


AGC CAA TAG 


CGG 


CTC CAT 


CGG 


GCT 


TTG CTG 


ala 


ser gin AMB 
151/51 


arg 


leu his 


arg 


ala 


leu leu 


GAC 


GTT GTC GGT 


GCC 


CGG TGA 


TAT 


ATT 


GGG TCA 


asp 


val val gly 


ala 


arg OPA 


tyr 


ile 


gly ser 




211/71 








CTG 


CGA CAC GCC 


GCC 


GCG GTG 


CTC 


GAG 


CCA GGC 


leu 


arg his ala 


ala 


ala val 


leu 


glu 


pro gly 




271/91 








ATT 


CAG AAC ATC 


TTG 


TAT CTC 


TTC 


CTC 


CGT GCC 


ile 


gin asn ile 


leu tyr leu 


phe 


leu 


arg ala 




331/111 








CCG 


GCA GAT CCC 


AGT 


TCA CCA 


GTC 


TCA 


CCA GAT 


pro 


ala asp pro 


ser 


ser pro 


val 


ser 


pro asp 



SEQ ID N° 14A 
FIGURE 14A 



62/21 
CGG CTG 
arg leu 
122/41 
TAG CGG 
AMB arg 
182/61 
ACG GGT 
thr gly 
242/81 
TAC GAC 
tyr asp 
302/101 





32/11 












CCG 


AAC GCC 


GTC 


GGC CAA CTT 


GGC 


CGC 


TGA GGG 


pro 


asn ala 


val 


gly gin leu 


gly 


arg 


OPA gly 




92/31 






CAA 


GCC AAT 


AGC 


GGC TCC ATC 


GGG 


CTT 


TGC TGG 


gin 


ala asn 


ser 


gly ser ile 


gly 


leu 


cys trp 




152/51 










ACG 


TTG TCG 


GTG 


CCC GGT GAT 


ATA 


TTG 


GGT CAG 


thr 


leu ser 


val 


pro gly asp 


ile 


leu 


gly gin 




212/71 










TGC 


GAC ACG 


CCG 


CCG CGG TGC 


TCG 


AGC 


CAG GCT 


cys 


asp thr 


pro 


pro arg cys 


ser 


ser 


gin ala 




272/91 








TTC 


AGA ACA 


TCT 


TGT ATC TCT 


TCC 


TCC 


GTG CCA 


phe 


arg thr 


ser 


cys ile ser 


ser 


ser 


val pro 




332/111 










CGG 


CAG ATC 


CCA 


GTT CAC CAG 


TCT 


CAC 


CAG ATC 


arg 


gin ile 


pro 


val his gin 


ser 


his 


gin ile 



SEQ ID N° 14B 
FIGURE 14B 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 ^^T/FR98/01813 



44/185 





















33/11 


















ACC GGG 


GCT 


GGA 


GGG 






V7lV7 




CGA 


ACG CCG TCG 


GCC 


AAC 


TTG 


GCC 


GCT 


GAG 


GGC 


thr gly 


ala 






p, 1 a 


asn 


val 


arg 


arg 


thr pro 


ser 


ala 


asn 


leu 


ala 


ala 


glu 


gly 




















93/31 














WVJU X VIM 


TCC 
i v^v* 


CCT 






Aw*. 




GGC 


AAG 


CCA ATA 


GCG 


GCT 


CCA 


TCG 


GGC 


TTT 


GCT 


GGT 


gly OPA 


ser 


pro 


gly 


pro 


arg 


arg 


gly 


lys 


pro ile 


ala 


ala 


pro 


ser 


ST 1 \» 


phe 


aid 


gly 


123/41 


















153/51 












AGC GGT 


TCG 


GCG 


GGA 


ACC 


GAG 


CGC 


CGA 


CGT 


TGT CGG 


TGC 


CCG 


GTG ATA 


TAT 


TGG 


GTC 


AGA 


ser gly 


ser 


ala 


gly 


thr 


glu 


arg 


arg 


arg 


cys arg 


cys 


pro 


val 


ile 


tyr 


trp 


val 


arg 


183/61 


















213/71 












CGG GTA 


TGG 


CGG 


CGA 


CTG 


AGG 


TGA 


TCT 


GCG 


ACA CGC 


CGC 


CGC 


GGT 


GCT 


CGA 


GCC 


AGG 


CTT 


arg val 


trp 


arg 


arg 


leu 


arg 


OPA 


ser 


ala 


thr arg 


arg 


arg 


gly ala 


arg 


ala 


arg 


leu 


243/81 


















273/91 














ACG ACC 


AGG 


GAA 


TTT 


CGA 


AAA 


TGT 


TAT 


TCA 


GAA CAT 


CTT 


GTA 


TCT 


CTT 


CCT 


CCG 


TGC 


CAC 


thr thr 


arg 


glu 


phe 


arg 


lys 


cys 


tyr 


ser 


glu his 


leu 


val 


ser 


leu 


pro 


pro 


cys 


his 


303/101 


















333/111 












CCC CTA 


GGT 


GTA 


GTG 


TTT 


TCG 


AGT 


ACC 


GGC 


AGA TCC 


CAG 


TTC 


ACC AGT 


CTC 


ACC 


AGA 


TC 


pro leu 


gly 


val 


val 


phe 


ser 


ser 


thr 


gly 


arg ser 


gin phe 


thr 


ser 


leu 


thr 


arg 



SEQ ID N° 14C 
FIGURE 14C 



partie de la sequence nucleotidique de seq!4A 
1/1 31/11 

TTT TCG AGT ACC GGC AGA TCC CAG GTT CAC CAG GTC TCA CCA GAT C 
phe ser ser thr gly arg ser gin val his gin val ser pro asp 



SEQ ID N° 14A' 
FIGURE 14A' 



I/ 1 31/11 

TGT TTT CGA GTA CCG GCA GAT CCC AGG TTC ACC AGG TCT CAC CAG ATC 
cys phe arg val pro ala asp pro arg phe thr arg ser his gin ile 



SEQ ID N° 14C 
FIGURE 14C 



1/1 31/11 

GTT TTC GAG TAC CGG CAG ATC CCA GGT TCA CCA GGT CTC ACC AGA TC 
val phe glu tyr arg gin ile pro gly ser pro gly leu thr arg 



SEQ ID N° 14C f 



FIGURE 14C» 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 




:T/FR98/01813 



45/185 



ORF predite d'apres la sequence publiee par Cole et al. (Nature 393-537-544) et 
contenant seql4A' 

1/1 31/11 
TAG CGG TTC GGC GGG AAG CTA GCG GCG ACG TTG TCG 
AMB arg phe gly gly l ys leu ala ala thr leu ser 
61/21 91/31 
ACG GGT ATG GCG GCG GCT GAG GTG ATC TGC GAC ACG 
thr gly met ala ala ala glu val ile cys asp thr 
121/41 151/51 
TAC GAC CAG GGA ATT TCG AAA ATG TTA TTC AGA ACA 
tyr asp gin gly ile ser lys met leu phe arg thr 
181/61 211/71 
CCC CTA GGT GTA GTG TTT TCG AGT ACC GGC AGA TCC 
pro leu gly val val phe ser ser thr gly arg ser 
241/81 271/91 
cca egg ggc gcg atg aac ttc ccg gca teg gca teg 
pro arg gly ala met asn phe pro ala ser ala ser 
301/101 331/1U 
tat gac ggg aat ctg gag cct tgt egg gee get caa 
tyr asp gly asn leu glu pro cys arg ala ala gin 
361/121 " 391/131 

teg ttg cca gat cct gtc aga ttc ccg att tec gca 
ser leu pro asp pro val arg phe pro ile ser ala 
421/141 

gac cgt tta cac taa 
asp arg leu his OCH 

SEQ ID N° 14F 
FIGURE 14F 



GTG 
val 


GCC 
ala 


GGT GAT 
gly asp 


ATA 
ile 


TTG 
leu 


GGT 
gly 


CAG 
gin 


CCG 
pro 


CCG 
pro 


CGG TGC 
arg cys 


TCG 
ser 


AGC 
ser 


CAG 

gin 


GCT 
ala 


TCT 

ser 


TGT 
cys 


ATC TCT 
ile ser 


TCT 
ser 


CCG 
pro 


TGC 
cys 


CAC 
his 


CAG 
gin 


GTT 
val 


CAC CAG 
his gin 


GTC 
val 


TCA 
ser 


CCA 
pro 


gat 
asp 


cca 
pro 


ggt 
gly 


cga egg 
arg arg 


a eg 
thr 


tgg 
trp 


teg 
ser 


cgc 
arg 


cat 
his 


ate 
ile 


gaa gat 
glu asp 


gca 
ala 


eta 
leu 


ctt 
leu 


gag 
glu 


aag 
lys 


gag 
glu 


egg tac 
arg tyr 


gec 
ala 


cat 
his 


gac 
asp 


cgt 
arg 



FEUILLE DE REMPLACEMENT (REGLE 26) 




WO 99/09186 PCT/FR98/0I813 



46/185 



Sequence Rv3054c predite par Cole et 1. (Nature 393:537-544) 
pouvant etre en phase avec Seql4A* 

1/1 

gtg tea gat acc < 
val ser asp thr 
61/21 

teg ttc aac cgc < 
ser phe asn arg c 
121/41 

acc atg ttc gag ( 
thr met phe glu < 
181/61 

gag gtg ccg gcg t 
glu val pro ala { 
241/81 

gtg gtc acg ccg c 
val val thr pro c 
301/101 

ctg tec agg cca t 
leu ser arg pro j 
361/121 

tec atg ggc cgc t 
ser met gly arg t 
421/141 



481/161 

teg gtc gcg gac gac 
ser val ala asp asp 
541/181 

get gag gtc ggc tga 
ala glu val gly OPA 











31/11 








tec 


gac ate 


aaa 


ate 




tta 


gtg 


gga 


ser 


asp ile 


lvs 
.b j a 


ile 


leu ala 


leu 


vaX 


gly 










91/31 






ate 


acc aaa 


ctg 




ycc aag 


gtc 


get 


ccg 


ile 


ala alu 


leu 


ala 


ala lys 


vajL 


axa 


pro 










151/^1 






eta 


aaa aac 


ctg 


ccg 


ht-f far 


aac 


gaa 


gac 


leu 


alv aso 


leu 


pro 


phe tyr 


asn 


/rl II 

gj_u 


asp 










211/71 






gtg 


age gcg 


ttg 


egg 


gag gec 


gcg 


tct 


gac 


val 


ser ala 


leu 


arg 


glu ala 


ala 


ser 


asp 










271/91 






tac 


aac ggc 


age 


att 


ccg gee 


gtg 


ate 


aag 


tyr 


asn gly 


ser 


ile 


pro ala 


val 


ile 


lys 










331/111 






ggc 


gat ggc 


gcg 


ttg 


aag gac 


aag 


ccg 


ttg 


gly 


asp gly 


ala 


leu 


lys asp 


lys 


pro 


leu 










391/131 






ggc 


ggg gta 


tgg 


gcg 


cac gac 


gag 


act 


cgc 


gly 


gly val 


trp 


ala 


his asp 


glu 


thr 


arg 










451/151 






gtc 


gat gcg 


ate 


aaa 


ctg teg 


gtg 


ccg 


ttc 


val 


asp ala 


ile 


lys 


leu ser 


val 


pro 


phe 










511/171 




gee 


ggg ctg 


gcg 


gcg 


aat gtg 


cgc 


gac 


gee 


ala 


gly leu 


ala 


ala 


asn val 


arg 


asp 


ala 



SEQ ID N° 14R 
FIGURE 14R 



FEUILLE DE REMPLACEMENT (REGLE 26) 




WO 99/09186 ^CT/FR98/01813 

47/185 

ORF predite par Cole et al. (Nature 393:537-544) et contenant Rv3054c 

V 1 31/11 
taa cgc 
OCH arg 
61/21 
caa gcg 
gin ala 
121/41 
gtg gga 
val gly 
181/61 
get ccg 
ala pro 
241/81 
gaa gac 
glu asp 
301/101 
tct gac 
ser asp 
361/121 
ate aag 
ile lys 
421/141 
ccg ttg 
pro leu 
481/161 
act cgc 
thr arg 
541/181 
ccg ttc 
pro phe 
601/201 

gac gec gtc ggc aac ttg gec get 
asp ala val gly asn leu ala ala 

SEQ ID N° 14P 
FIGURE 14P 



gat 


egg 


aat 


aaa teg 


gac 


cat ggt ccg gtt 


asp 


arg 


asn 


lys 


ser 


asp 


his gly pro val 














91/31 


gaa 


agg 


aac 


gta gca 


gtg 


tea gat ace aag 


glu 


arg 


asn 


val 


ala 


val 


ser asp thr lys 














151/51 


age 


ctg 


cgc 


gcg 


gcg 


teg 


ttc aac cgc cag 


ser 


leu 


arg 


ala 


ala 


ser 


phe asn arg gin 














211/71 


gac 


ggc 


gtc 


ace 


gtc 


ace 


atg ttc gag ggg 


asp 


gly val 


thr 


val 


thr 


met phe glu gly 


ate 












271/91 


gac 


aca 


gcg acg 


gag 


gtg ccg gcg ccg 


ile 


asp 


thr 


ala 


thr 


glu 


val pro ala pro 














331/111 


gcg 


cac 


get 


gee 


ttg 


gtg 


gtc acg ccg gaa 


ala 


his 


ala 


ala 


leu 


val 


val thr pro glu 














391/131 


aac 


gcg 


ate 


gac 


tgg 


ctg 


tec agg cca ttc 


asn 


ala 


ile 


asp 


trp 


leu 


ser arg pro phe 














451/151 


gec 


gtg ate 


ggc 


ggc 


tec 


atg ggc cgc tac 


ala 


val 


ile 


gly gly 


ser 


met gly arg tyr 














511/171 


aag 


teg ttc 


age 


ate 


get 


ggc acg egg gtg 


lys 


ser phe 


ser 


ile 


ala 


gly thr arg val 














571/191 


caa 


act 


ctg 


ggc 


aag 


teg 


gtc gcg gac gac 


gin 


•thr 


leu 


gly lys 


ser 


val ala asp asp 


gtc 












631/211 


ggc 


aac 


ttg 


gec 


get 


gag gtc ggc tga 


val 


gly asn 


leu 


ala 


ala 


glu val gly OPA 



FEUILLE DE REMPLACEMENT (REGLE 26) 




WO 99/09186 ^PCT/FR98/01813 

48/185 

fragment d'apres la sequence publiee par Cole et al. (Nature 393:537-544) et contenant 
seq 14F' et seq 14P' 

1/1 31/11 

taa cgc gat egg aat aaa teg gac cat ggt ccg gtt ggc teg tgc aag gac gtg gac caa 
OCH arg asp arg asn lys ser asp his gly pro val gly ser cys lys asp val asp gin 
asn ala ile gly tie asn arg thr met val arg leu ala arg ala arg thr trp thr asn 
thr arg ser glu OCH ile gly pro trp ser gly trp leu val gin gly arg gly pro thr 
61/21 91/31 

caa gcg gaa agg aac gta gca gtg tea gat ace aag tec gac ate aaa ate ttg gee tta 
gin ala glu arg asn val ala val ser asp thr lys ser asp ile lys ile leu ala leu 
lys arg lys gly thr AMB gin cys gin ile pro ser pro thr ser lys ser trp pro AMB 
ser gly lys glu arg ser ser val arg tyr gin val arg his gin asn leu gly leu ser 
121/41 151/51 

gtg gga age ctg cgc gcg gcg teg ttc aac cgc cag ate gee gag ctg get gec aag gtc 
val gly ser leu arg ala ala ser phe asn arg gin ile ala glu leu ala ala lys val 
trp glu ala cys ala arg arg arg ser thr ala arg ser pro ser trp leu pro arg ser 
gly lys pro ala arg gly val val gin pro pro asp arg arg ala gly cys gin gly arg 
181/61 211/71 

get ccg gac ggc gtc ace gtc acc atg ttc gag ggg ctg ggg gac ctg ccg ttc tac aac 
ala pro asp gly val thr val thr met phe glu gly leu gly asp leu pro phe tyr asn 
leu arg thr ala ser pro ser pro cys ser arg gly trp gly thr cys arg ser thr thr 
ser gly arg arg his arg his his val arg gly ala gly gly pro ala val leu gin arg 
241/81 271/91 

gaa gac ate gac aca gcg acg gag gtg ccg gcg ccg gtg age gcg ttg egg gag gec gcg 
glu asp ile asp thr ala thr glu val pro ala pro val ser ala leu arg glu ala ala 
lys thr ser thr gin arg arg arg cys arg arg arg Opa ala arg cys gly arg pro arg 
arg his arg his ser asp gly gly ala gly ala gly glu arg val ala gly gly arg val 
301/101 331/111 

tct gac gcg cac get gec ttg gtg gtc acg ccg gaa tac aac ggc age att ccg gee gtg 
ser asp ala his ala ala leu val val thr pro glu tyr asn gly ser ile pro ala val 
leu thr arg thr leu pro trp trp ser arg arg asn thr thr ala ala phe arg pro OPA 
OPA arg ala arg cys leu gly gly his ala gly ile gin arg gin his ser gly arg asp 
361/121 391/131 

ate aag aac gcg ate gac tgg ctg tec agg cca ttc ggc gat ggc gcg ttg aag gac aag 
ile lys asn ala ile asp trp leu ser arg pro phe gly asp gly ala leu lys asp lys 
ser arg thr arg ser thr gly cys pro gly his ser ala met ala arg OPA arg thr ser 
gin glu arg* asp arg leu ala val gin ala ile arg arg trp arg val glu gly gin ala 
421/141 451/151 

ccg ttg gec gtg ate ggc ggc tec atg ggc cgc tac ggc ggg gta tgg gcg cac gac gag 
pro leu ala val ile gly gly ser met gly arg tyr gly gly val trp ala his asp glu 
arg trp pro OPA ser ala ala pro trp ala ala thr ala gly tyr gly arg thr thr arg 
val gly arg asp arg arg leu his gly pro leu arg arg gly met gly ala arg arg asp 
481/161 511/171 

act cgc aag teg ttc age ate get ggc acg egg gtg gtc gat gcg ate aaa ctg teg gtg 
thr arg lys ser phe ser ile ala gly thr arg val val asp ala ile lys leu ser val 
leu ala ser arg ser ala ser leu ala arg gly trp ser met arg ser asn cys arg cys 
ser gin val val gin his arg trp his ala gly gly arg cys asp gin thr val qly ala 
541/181 571/191 

ccg ttc caa act ctg ggc aag teg gtc gcg gac gac gee ggg ctg gcg gcg aat gtg cgc 
pro phe gin thr leu gly lys ser val ala asp asp ala gly leu ala ala asn val arg 
arg ser lys leu trp ala ser arg ser arg thr thr pro gly trp arg arg met cys ala 

val pro asn ser gly gin val gly arg gly arg arg arg ala gly gly glu cys ala arg 
601/201 631/211 

gac gee gtc ggc aac ttg gec get gag gtc ggc tga tec ctg ggc cga ggc ggg tea gec 
asp ala val gly asn leu ala ala glu val gly OPA ser leu gly arg gly gly ser ala 
thr pro ser ala thr trp pro leu arg ser ala asp pro trp ala glu ala gly gin pro 
arg arg arg gin leu gly arg OPA gly arg leu ile pro gly pro arg arg val ser gin 
661/221 691/231 

aat age ggc tec ate ggc ttt get ggt age ggt teg gcg gga age tag egg cga cgt tgt 
asn ser gly ser ile gly phe ala gly ser gly ser ala gly ser AMB arg arg arg cys 
ile ala ala pro ser ala leu leu val ala val arg arg glu ala ser gly asp val val 
AMB arg leu his arg leu cys trp AMB arg phe gly gly lys leu ala ala thr leu ser 



SEQ ID N° 14Q 
FEUILLE DE REM£lr£6^Ef^REGLE 26) 



WO 99/09186 ^^7FR98/01813 



49/185 



721/241 751/251 

egg tgg ccg gtg ata tat tgg gtc aga egg gta tgg egg egg ctg agg tga tct gcg aca 
arg trp pro val He tyr trp val arg arg val trp arg arg leu arg OPA ser ala thr 
gly gly arg OPA tyr ile gly ser asp gly tyr gly gly gly OPA gly asp leu arg his 
yal ala gly asp ile leu gly gin thr gly met ala ala ala glu val ile cys asp thr 
781/261 611/271 

cgc cgc cgc ggt get cga gee agg ctt acg ace agg gaa ttt cga aaa tgt tat tea gaa 
arg arg arg gly ala arg ala arg leu thr thr arg glu phe arg lys cys tyr ser glu 
ala ala ala val leu glu pro gly leu arg pro gly asn phe glu asn val ile gin asn 

641/28i r ° ^ a3 871/291 ly ^ ^ ^ 

cat ctt gta tct ctt etc cgt gee acc ccc tag gtg tag tgt ttt cga gta ccg gca gat 
his leu val ser leu leu arg ala thr pro AMB val AMB cys phe arg val pro ala asp 
ile leu tyr leu phe ser val pro pro pro arg cys ser val phe glu tyr arg gin ile 

a^!™? 7 * SBr 3er PC ° Cys his pro leu val val P he 3e * »er thr gly arg ser 
901/301 931/311 

ccc agg ttc acc agg tct cac cag ate cac ggg gcg cga tga act tec egg cat cga cat 
pro arg phe thr arg ser his gin ile his gly ala arg OPA thr ser arg his arg his 
pro gly ser pro gly leu thr arg ser thr gly arg asp glu leu pro gly ile gly ile 

aJ)^ gln Val Ser Pr ° asp pro arg gl * ala mefc a5n P he P^<> ala ser ala ser 

ybl/321 991/331 

cgc cag gtc gac gga cgt ggt cgc get atg acg gga ate tgg age ctt gtc ggg ccg etc 
arg gin val asp gly arg gly arg ala met thr gly ile trp ser leu val gly pro leu 
ala arg ser thr asp val val ala leu OPA arg glu ser gly ala leu ser gly arg ser 

infi r %!i y ^ thr trP 3er arg tyr aSp gly a3n leu * lu P ro W ^ *1* ala gin 
1021/341 1051/351 

aac ata teg aag atg cac tac ttg agt cgt tgc cag ate ctg tea gat tec cga ttt cca 
asn xle ser lys met his tyr leu ser arg cys gin ile leu ser asp ser arg phe pro 
thr tyr arg arg cys thr thr OPA val val ala arg ser cys gin ile pro asp phe arg 

ia«%« 5 33P ieU XeU glU Ser leU pro asp pro val ar * P h * P ro ser ala 
1081/361 1111/371 

caa agg age ggt acg ccc atg acc gtg acc gtt tac act aa 

gin arg ser gly thr pro met thr val thr val tyr thr 

lys gly ala val arg pro OPA pro OPA pro phe thr leu 

-lys glu arg tyr ala his asp arg asp arg leu his OCH 

SEQ ID N° 14Q (suite) 
FIGURE 14Q (suite) 



1/1 

CAA GCC CGG CCG CGA CTG TTT 
gin ala arg pro arg leu phe 
61/21 

GCG CAC CAT GGT GTG CAC CAG 
ala his his gly val his gin 
121/41 

CGA TGC CCG CGC CCC GGC GGC 
arg cys pro arg pro gly gly 
181/61 

GGC GGA CCA GTC GGC GAT GTC 
gly gly pro val gly asp val 
241/81 

GTC TGA GGT GGC GAA GAC CAG 
val OPA gly gly glu asp gin 









31/11 




GCC 


GTT 


TTG 


GGG CTC 


CTA 


ala 


val 


leu 


gly leu 


leu 








91/31 




TTG 


CGA 


TCG 


GTT CCT 


CCC 


leu 


arg 


ser 


val pro 


pro 








151/51 


GCA 


GCT 


GCG 


TAG CTC 


GAC 


ala 


ala 


ala 


AMB leu 


asp 








211/71 


GAG 


GCG 


ATG 


GCA ATA 


CAG 


glu 


ala 


met 


ala ile 


gin 








271/91 


TCC 


CGC 


GCC 


CAC CGG 


CAG 


ser 


arg 


ala 


his arg 


gin 



SEQ ID N° ISA 



CCA GAA CAC CAC CTG GCG GCC 
pro glu his his leu ala ala 

GCG CGC GGG CGG CGA CGA CGT 
ala arg gly arg arg arg arg 

CCG GTC GAC GAC GAC GGG GTC 
pro val asp asp asp gly val 

CGC CTT GGT GCG CGG CCA CAC 
arg leu gly ala arg pro his 

CCG GAT CCG GAT ACG CGG TAC 
pro asp pro asp thr arg tyr 



FEUILLE DE REMPLA^B^REGLE 26) 



WO 99/09186 




AAG CCC 


GGC 


CGC 


GAC 


TGT 


lys pro 


gly 


arg 


asp 


cys 


62/21 










CGC ACC 


ATG 


GTG 


TGC 


ACC 


arg thr 


met 


val 


cys 


thr 


122/41 










GAT GCC 


CGC 


GCC 


CCG 


GCG 


asp ala 


arg 


ala 


pro 


ala 


182/61 










GCG GAC 


CAG 


TCG 


GCG 


ATG 


ala asp 


gin 


ser 


ala 


met 


242/81 










TCT GAG 


GTG 


GCG 


AAG 


ACC 


ser glu 


va± 


ala lys 


thr 


AGC CCG 


GCC 


GCG 


ACT 


GTT 


ser pro 


ala 


ala 


thr 


val 


63/21 










GCA CCA 


TGG 


TGT 


GCA 


CCA 


ala pro 


trp 


cys 


ala 


pro 


123/41 








ATG CCC 


GCG 


CCC 


CGG 


CGG 


met pro 


ala 


pro 


arg 


arg 


183/61 










CGG ACC 


AGT 


CGG 


CGA 


TGT 


arg thr 


ser 


arg 


arg 


cys 


243/81 










CTG AGG 


TGG 


CGA AGA 


CCA 


leu arg 


trp 


arg 


arg 


pro 



50/185 



32/11 

TTG CCG TTT TGG GGC TCC TAC 
leu pro phe trp gly ser tyr 
92/31 

AGT TGC GAT CGG TTC CTC CCG 
ser cys asp arg phe leu pro 
152/51 

GCG CAG CTG CGT AGC TCG ACC 
ala gin leu arg ser ser thr 
212/71 

TCG AGG CGA TGG CAA TAC AGC 
ser arg arg trp gin tyr ser 
272/91 

AGT CCC GCG CCC ACC GGC AGC 
ser pro ala pro thr gly ser 



SEQ ID N° 15B 
FIGURE 15B 











33/11 




TGC 


CGT 


TTT 


GGG 


GCT CCT 


ACC 


cys 


arg phe 


giy 


ala pro 


thr 










93/31 




GTT 


GCG 


ATC 


GGT 


TCC TCC 


CGC 


val 


ala 


ile 


gly 


ser ser 


arg 










153/51 




CGC 


AGC 


TGC 


GTA 


GCT CGA 


CCC 


arg 


ser 


cys 


val 


ala arg 


pro 










213/71 




CGA 


GGC 


GAT 


GGC 


AAT ACA 


GCG 


arg gly asp 


gly 


asn thr 


ala 










273/91 




GTC 


CCG 


CGC 


CCA 


CCG GCA 


GCC 


val 


pro 


arg 


pro 


pro ala 


ala 



SEQ ID N° 15C 
FIGURE 15C 



PCT/FR98/01813 



CAG AAC 
gin asn 


ACC 
thr 


ACC 
thr 


TGG 
trp 


CGG 
arg 


CCG 
pro 


CGC 
arg 


GCG 
ala 


GGC 
gly 


GGC 
gly 


GAC 
asp 


GAC 
asp 


GTC 
val 


CGG 
arg 


TCG 
ser 


ACG 
thr 


ACG 
thr 


ACG 
thr 


GGG 
gly 


TCG 
ser 


GCC 
ala 


TTG 
leu 


GTG 
val 


CGC 
arg 


GGC 
gly 


CAC 
his 


ACG 
thr 


CGG 
arg 


ATC 
ile 


CGG 
arg 


ATA 
ile 


CGC 
arg 


GGT 
gly 


AC 


AGA ACA 
arg thr 


CCA 
pro 


CCT 
pro 


GGC 
gly 


GGC 
gly 


CGC 
arg 


GCG 
ala 


CGG 
arg 


GCG 
ala 


GCG 
ala 


ACG 
thr 


ACG 
thr 


TCG 
ser 


GGT CGA 
gly arg 


CGA 
arg 


CGA 
arg 


CGG 
arg 


GGT 
gly 


CGG 
arg 


CCT 
pro 


TGG 
trp 


TGC 
cys 


GCG 
ala 


GCC 
ala 


ACA 
thr 


CGT 
arg 


GGA 
gly 


TCC 
ser 


GGA 

gly 


TAC 
tyr 


GCG 
ala 


GTA 
val 


C 



FEUILLE DE REMPLACEMENT (REGLE 26) 



PCT/FR98/01813 

51/185 

partie de la sequence nucleotidique de seq!5A 
1/1 31/11 

GGC GGC CGC GCG CCA TGG TGT GCA CCA GTT GCG ATC GGT TCT CCC GCG CGC GGG CGG CGA 
gly gly arg ala pro trp cys ala pro val ala lie gly ser pro ala arg gly arg arg 
61/21 91/31 

CGA CGT CGA TGG CCG CGC CCC GGC GGC TGC AGC TGC GTA GCT CGA CCC GGT CGA CGA CGA 

^?/^f g " 9 trP Pr ° aEg P " gly gly cys ser c * 3 val ala ar 9 gly arg arg arq 
121/41 151/51 

CGG GGT CGG CGG GCC AGT CGG CGA TGT CGA GGC GAT GGC AAT ACA GCG CCT TGG TGC GCG 

" 9 arg arg ° yS arg gly asp 9 ly asn thr ala P"> trp cys ala 

181/61 211/71 

GCC ACA CGT CTG AGG TGG CGA AGA CCA GTC CCG CGC CCA CCG GCA GCC GGA TC 

ala thr arg leu arg trp arg arg pro val pro arg pro pro ala ala gly 

SEQ ID N° 15A' 
FIGURE 15A' 



1/1 31/11 

GCG GCC GCG CGC CAT GGT GTG CAC CAG TTG CGA TCG GTT CTC CCG CGC GCG GGC GGC GAC 
alalia ala arg his gly val his gin leu arg ser val leu pro arg ala gly gly a3 p 

GAC GTC GAT GGC CGC GCC CCG GCG GCT GCA GCT GCG TAG CTC GAC CCG GTC GAC GAC GAC 

ITlul 9ly 313 Pr ° ala ala ala ala ala ™ B leu «P P- val asp aVp Sp 

121/41 151/51 

GGG GTC GGC GGG CCA GTC GGC GAT GTC GAG GCG ATG GCA ATA CAG CGC CTT GGT GCG CGG 
jl^Vjl gly gly pro val gly asp val glu ala^et ala ile gin arg leu gly ala arg 

CCA CAC GTC TGA GGT GGC GAA GAC CAG TCC CGC GCC CAC CGG CAG CCG GAT C 
pro his val OPA gly gly glu asp gin ser arg ala his arg gin pro asp 

SEQ ID N° 15B' 
FIGURE 15B' 



1/1 31/11 

tro arc ^ ^ ^ ^ AGT TGC GAT CGG TTC TCC CGC G <* CGG GCG GCG 

trp«g pro arg ala met val cys thr ser cys asp arg phe ser arg ala arg ala ala 

ACG ACG TCG ATG GCC GCG CCC CGG CGG CTG CAg'cTG CGT AGC TCG ACC CGG TCG ACG ACG 

ul/Tl PC ° ar9 IS, 1 ™ arg SCC Ser thc ser th r thr 

ACG GGG TCG GCG GGC CAG TCG GCG ATG TCG AGG CGA TGG CAA TAG AGC GCC TTG GTG CGC 

mm" ^ g III'? trp gln tyr s " ala 1«U val arg 

GGC CAC ACG TCT GAG GTG GCG AAG ACC AGT CCC GCG CCC ACC GGC AGC CGG ATC 

gly his thr ser glu val ala lys thr ser pro ala pro thr gly ser arg ile 

SEQ ID N° 15C 



FEUILLE DE REWffifcACSMEHf (REGLE 26) 




WO 99/09186 PCT/FR98/01813 



52/185 



ORF contenant Seql5A' oVapres Cole et 



1/1 


















taa ggt 


ceo 


cca 


a eg 


ctt 


tac 


get 




egg 


OCH gly 


pro 


pro 


thr 


leu 




a x a 


a ra 
a j. y 


a m 
a ty 


61/21 


















cat act 


cgc 


cgc 


agg 


gca 


999* 




ccc 


gcg 


a r g ser 


a rg 


arg 


arg 


ala 


gly 


leu 


pro 


a 1 a 


121/41 
















aaa oat 
*"*yy yy w 


aoc 


att 


cat 


yyy 


cgt 




cga 


a 


ara alv 


ser 


val 


ara 


alv 


arg 


arg 


arg 




181/61 


















coa too 


aaa 


tgc 


gca 


CaC 


cca 


gec 


gcg 


act 


ara trp 


olv 


CVS 


ala 


arg 


pro 


ala 


ala 


thr 


241/81 
















cca cct 


ooc 
yy- 


aac 
yy w 


cgc 


y*-y 


cca. 


tgg 


tgt 


gca 


pro pro 


alv 


al v 


arg 


ala 


pro 


t rn 

Lip 


cys 


old 


301/101 


















egg cga 


caa 


cat 

w 3 w 


caa 

\-y a. 


taa 
v yy 


ccg 


cgc 


CCC 


nor 
ygc 


arg arg 


arg 


arg 


arg 


trp 


pro 


arg 


pro 


gly 


361/121 
















cga cga 


egg 


ggt 


egg 


egg 


gee 


agt 


egg 


cga 


arg arg 


arg 


gly 


arg 


arg 


ala 


ser 


arg 


arg 


421/141 














tgc gcg 


gec 


aca 


cgt 


ctg 


agg 


tgg 


cga 


aga 


cys ala 


ala 


thr 


arg 


leu 


arg 


trp 


arg 


arg 


481/161 


















ggt agg 


gca 


ggc 


gcg 


agt 


ctt 


cag 


egg 


ggt 


gly arg 


ala 


gly 


ala 


ser 


leu 


gin 


arg 


gly 


541/181 














agg gta 


egg 


gcg 


gcg 


tac 


ggc 


aac 


ggt 


gaa 


arg val 


arg 


ala 


ala 


tyr 


gly 


asn 


gly 


glu 


601/201 














cga agg 


ggc 


agg 


tga 












arg arg 


gly 


arg 


OPA 













- (Nature 393:537-544) 



31/11 


















ccg cca 
91/31 


cga 
a rg 


gtt 
vai 


ggc 
gly 


egg 
arg 


cca 
pro 


ctt 
leu 


tea 
ser 


ggc 
gly 


teg tct 

oCL SCI 

151/51 


teg 
ser 


egg 
arg 


gtt 
vai 


tgt 
cys 


egg 
arg 


caa 
gin 


agg 
arg 


tgt 
cys 


tgt gca 

c\/«i ala 
t-yj din 

211/71 


get 

a > a 
ala 


egg 
arg 


gga 
gly 


tgc 
cys 


egg 
arg 


egg 
arg 


cgc 
arg 


ggg 
giy 


gtt tgc 
val cys 
271/91 


gcg 

ala 


ttt 
phe 


tgg 


ggc 
gly 


tct 
ser 


gec 
ala 


aga 
arg 


aca 
tnr 


cca gtt 
pro val 
331/111 


gcg 
ala 


ate 
lie 


QOt 
gly 


tct 
ser 


ccc 
pro 


aca 
ala 


cgc 
arg 


aaa 

yyy 
gly 


ggc tgc 
gly cys 
391/131 


age 
ser 


tgc 
cys 


gta 
val 


get 
ala 


cga 
arg 


ccc 
pro 


ggt 
gly 


cga 
arg 


tgt cga 
cys arg 
451/151 


ggc 
gly 


gat 
asp 


ggc 
gly 


aat 
asn 


aca 
thr 


gcg 
ala 


cct 
pro 


tgg 
trp 


cca gtc 
pro val 
511/171 


ccg 
pro 


cgc 
arg 


cca 
pro 


ccg 
pro 


gca 
ala 


gec 
ala 


gga 
gly 


tea 
ser 


tgg egg 
trp arg 
571/191 


cga 
arg 


cga 
arg 


gca 
ala 


get 
ala 


cca 
pro 


cag 
gin 


agt 
ser 


gtg 
val 


gca ggc 
ala gly 


act 
thr 


ccg 
pro 


a eg 
thr 


aac 
asn 


cca 
pro 


teg 
ser 


tea 
ser 


cgt 
arg 



SEQ ID N° 15F 
FIGURE 15F 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 ^^PCT/FR98/01813 

53/185 

R:Rv2530c predite d'apres Cole et al. (Nature 393:537-S44)et pouvant etre en 
phase avec 5EQISA 

1/1 31/11 
gtg acg gca ctg etc gat gtc aat gtg ctg ate gcg 
val thr ala leu leu asp val asn val leu ile ala 
61/21 91/31 
cat gcg gcc gcg cag cga tgg ttc acg cag ttc tec 
his ala ala ala gin arg trp phe thr gin phe ser 
121/41 151/5l 
ate acc gag gca ggg tat gtc cga att tea age aat 
ile thr glu ala gly tyr val arg ile ser ser asn 
181/61 211/71 
acg ccg get ate gcg ate get cag ttg gcg gcg atg 
thr pro ala ile ala ile ala gin leu ala ala met 
241/81 271/91 
tgg cct gac gat gtg cca ctg ate gtt ggg age gcc 
trp pro asp asp val pro leu ile val gly ser ala 
301/101 331/111 
cac cgt egg gtc acc gac tgc cat etc ate gcc ttg 
his arg arg val thr asp cys his leu ile ala leu 
361/121 391/m 
gtc aca ttc gat gcc gca ctg gcc gat tea gca tec 
val thr phe asp ala ala leu ala asp ser ala ser 

SEQ ID N* 15R 
FIGURE 15R 

SeqlSP: ORF d'apres Cole et al. (Nature 393:537-544) eontenant Rv2530c 
1/1 31/11 
tga tgt tec gcc gga tgc gcc gac ggt gac ttc cga 
OPA cys ser ala gly cys ala asp gly asp phe arg 
61/21 91/31 
cga cgt gtg acg gca ctg etc gat gtc aat gtg ctg 
arg arg val thr ala leu leu asp val asn val leu 
121/41 151/51 
gtt cac cat gcg gcc gcg cag cga tgg ttc acg cag 
val his his ala ala ala gin arg trp phe thr gin 
181/61 211/71 
acg ccg ate acc gag gca ggg tat gtc cga att tea 
thr pro ile thr glu ala gly tyr val arg ile ser 
241/81 271/91 
teg acc acg ccg get ate gcg ate get cag ttg gcg 
ser thr thr pro ala ile ala ile ala gin leu ala 
301/101 331/111 
acg ttt tgg cct gac gat gtg cca ctg ate gtt ggg 
thr phe trp pro asp asp val pro leu ile val qlv 
361/121 ~ * 391/ ^ 

tec aac cac cgt egg gtc acc gac tgc cat etc ate 
ser asn his arg arg val thr asp cys his leu ile 
421/141 451/151 



ctg ggc 
leu gly 


tgg 
trp 


ccg 
pro 


aat 
asn 


cac gtt cac 
his val his 


teg aat 
ser asn 


ggg 

alv 


tgg 
trp 


gcc 
ala 


acc acg ccg 

W1L Li IX. pro 


cgc agt 
arg ser 


gtg 
val 


atg 
met 


cag 
gin 


gtg teg acc 
val ser thr 


act tct 
thr ser 


ctt 
leu 


gcc 
ala 


ggg 

gly 


cac acg ttt 
his thr phe 


ggc gat 
gly asp 


cgc 
arg 


gat 
asp 


gcg 
ala 


gtg tec aac 
val ser asn 


gcc gcg 
ala ala 


cgc 
arg 


tac 
tyr 


ggg 

gly 


ggc egg ttg 
gly arg leu 


gca ggc 
ala gly 


etc 
leu 


gtc 
val 


gag 
glu 


gtg ttg tag 
val leu AMB 



481/161 
ttg tag 
leu AMB 



cgt 
arg 


ccg 
pro 


cgc 
arg 


get cga gga 
ala arg gly 


ctg 
leu 


ggc 

gly 


tgg 
trp 


ccg aat cac 
pro asn his 


teg 
ser 


aat 
asn 


ggg 

gly 


tgg gcc acc 
trp ala thr 


cgc 
arg 


agt 
ser 


gtg 
val 


atg cag gtg 
met gin val 


act 
thr 


tct 
ser 


ctt 
leu 


gcc ggg cac 
ala gly his 


ggc 
gly 


gat 
asp 


cgc 
arg 


gat gcg gtg 
asp ala val 


gcc 
ala 


gcg 
ala 


cgc 
arg 


tac ggg ggc 
tyr gly gly 


gca 
ala 


ggc 
gly 


etc 
leu 


gtc gag gtg 
val glu val 



SEQ ID N" 15P 
FEUILLE DE REMfl^^^REGLE 26) 



WO 99/09186 




PCT/FR98/01813 



54/185 



Fragment contenant SeqlSP' et Seq 15F' 
1/1 31/11 

tga tgt tec gec gga tgc gec gac ggt gac ttc cga gga tgt cgt ccg cgc get cga gga 
OPA cys ser ala gly cys ala asp gly asp phe arg gly cys arg pro arg ala arg gly 
asp val pro pro asp ala pro thr val thr ser glu asp val val arg ala leu glu asp 
Met phe arg arg met arg arg arg OPA leu pro arg met ser ser ala arg ser arg thr 
61/21 91/31 

cga cgt gtg acg gca ctg etc gat gtc aat gtg ctg ate gcg ctg ggc tgg ccg aat cac 
arg arg val thr ala leu leu asp val asn val leu ile ala leu gly trp pro asn his 

asp val OPA arg his cys ser met ser met cys OPA ser arg trp ala gly arg ile thr 
thr cys asp gly thr ala arg cys gin cys ala asp arg ala gly leu ala glu ser arc 
121/41 151/51 y 

gtt cac cat gcg gec gcg cag cga tgg ttc acg cag ttc tec teg aat ggg tgg gec ace 
val his his ala ala ala gin arg trp phe thr gin phe ser ser asn gly trp ala thr 

phe thr met arg pro arg ser asp gly ser arg ser ser pro arg met gly gly pro pro 
ser pro cys gly arg ala ala met val his ala val leu leu glu trp val gly his his 
181/61 211/71 

acg ccg ate ace gag gca ggg tat gtc cga att tea age aat cgc agt gtg atg cag gtg 
thr pro ile thr glu ala gly tyr val arg ile ser ser asn arg ser val met gin val 
arg arg ser pro arg gin gly met ser glu phe gin ala ile ala val OPA cys arg cys 
ala asp his arg gly arg val cys pro asn phe lys gin ser gin cys asp ala gly val 
241/81 271/91 

teg ace acg ccg get ate gcg ate get cag ttg gcg gcg atg act tct ctt gee ggg cac 
ser thr thr pro ala ile ala ile ala gin leu ala ala met thr ser leu ala gly his 
arg pro arg arg leu ser arg ser leu ser trp arg arg OPA leu leu leu pro gly thr 
asp his ala gly tyr arg asp arg ser val gly gly asp asp phe ser cys arg ala his 
301/101 331/111 

acg ttt tgg cct gac gat gtg cca ctg ate gtt ggg age gee ggc gat cgc gat gcg gtg 
thr phe trp pro asp asp val pro leu ile val gly ser ala gly asp arg asp ala val 
arg phe gly leu thr met cys his OPA ser leu gly ala pro ala ile ala met arg cy3 
val leu ala OPA arg cys ala thr asp arg trp glu arg arg arg ser arg cys gly vai 
361/121 391/131 

tec aac cac cgt egg gtc acc gac tgc cat etc ate gee ttg gee gcg cgc tac ggg ggc 
ser asn his arg arg val thr asp cys his leu ile ala leu ala ala arg tyr gly gly 
pro thr thr val gly ser pro thr ala ile ser ser pro trp pro arg ala thr gly ala 
gin pro pro ser gly his arg leu pro ser his arg leu gly arg ala leu arg gly pro 
421/141 451/151 

egg ttg gtc aca ttc gat gee gca ctg gee gat tea gca tec gca ggc etc gtc gag gtg 
arg leu val thr phe asp ala ala leu ala asp ser ala ser ala gly leu val glu val 
gly trp ser his ser met pro his trp pro ile gin his pro gin ala ser ser arg cys 
val gly his ile arg cys arg thr gly arg phe ser ile arg arg pro arg arg gly val 
481/161 511/171 

ttg tag tea ccg ggg atg ggc ggc teg cca ggc ctg cag gat ctg egg gcg cag gcg ccc 
leu AMB ser pro gly met gly gly ser pro gly leu gin asp leu arg ala gin ala pro 
cys ser his arg gly trp ala ala arg gin ala cys arg ile cys gly arg arg arg pro 
val val thr gly asp gly arg leu ala arg pro ala gly ser ala gly ala gly ala pro 
541/181 571/191 

ccg gtc gga cac egg cag gec gac get ttt ggc cca cgc gcg cag etc ggc get get ggg 
pro val gly his arg gin ala asp ala phe gly pro arg ala gin leu gly ala ala gly 
arg ser asp thr gly arg pro thr leu leu ala his ala arg ser ser ala leu leu gly 
gly arg thr pro ala gly arg arg phe trp pro thr arg ala ala arg arg cys trp ala 
601/201 631/211 

etc ggg etc ggc ggc age egg etc gaa aac cgt ggt ggc gtc ggc ate gtc gac gaa cca 
leu gly leu gly gly ser arg leu glu asn arg gly gly val gly ile val asp glu pro 
ser gly ser ala ala ala gly ser lys thr val val ala sec ala ser ser thr asn gin 
arg ala arg arg gin pro ala arg lys pro trp trp arg arg his arg arg arg thr arg 



SEQ ID N° 15Q 

FIGURE 15Q 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 ^^PCT/FR98/01813 

55/185 



661/221 691/231 

Wt gag ggc ggc ggc tag ata gcg gta ggt gta ttc ctg ggc gag ctt gcg ggt ttg gca 
gly glu gly gly gly AMB ile ala val gly val phe leu gly glu leu all gly leu ala 

V oL"? aU 313 313 " 9 arg M val tyr ser tr P ala 3 " 1^ arg vll trp gin 
721/241 " 9 atg Cy 7si^ 5 r° gly arg 413 CyS gly phe "« 

gaa cac gat egg cac gtt ggg aaa gec gat ctg caa ttc ggc cag ccc ate ggc gat cgc 
glu his asp arg hi5 val gly lys ala asp leu gin phe gly gin pro ile g£y Lp «g 

asn thr He gly thr leu gly ly 3 pro ile cys a 3 n ser ala ser pro ser ala ile ala 

TsSm^ ^ ^ ^ U arg 3e nS a 7 " e 3X9 Pr ° aU h " " g arg 3er pro 

cgt egg gcg ggc gaa gga gtg cgc gaa gat etc cga gta gcg gtc etc gac cac cac ggc 
arg arg ala gly glu gly val arg glu asp leu arg val ala val leu asp his his gly 
val gly arg ala lys glu cys ala lys ile ser glu AMB arg ser ser thr thr thr ala 

84 " 9 " g ^ " g ^m/lgr' Pr ° 3rg Pr ° P " aXg arg 

ggc ccg tgg cag cgc ggc cag ttc ggt cag ttg gta ttt cag gtt gee gtt cag cac gee 
gly pro trp gin arg gly gin phe gly gin leu val phe gin val ala val gin his ala 
ala arg gly 3 er ala ala ser ser val ser trp tyr phe arg leu pro phe ser thr pro 

90 P /3 0 r " g Val ^ Va 9 3 g / y n le glY CyS aCg 3Cr ala ar 9 ^n 

aga agt aag gtc cgc caa cgc ttt acg etc gac ggc cgc cac gag ttg gee ggc cac ttt 
arg ser lys val arg gin arg phe thr leu asp gly arg his glu leu ala giy his phe 
9 i U 36r aU aSn ala leU arg ser thr ala ala thc 3 « " P pro ala thr phe 

g«/^ 9 y Pr ° ^ l6U tyr 613 arg arg Pr ° pr ° ar * val P»l«*t 
961/321 991/331 

cag gec gta gtc gee gca ggg cag ggc ttc ccg cgt cgt ctt cgc ggg ttt gtc ggc aaa 
gin ala val val ala ala gly gin gly phe pro arg arg leu arg gly phe val gly ly 3 
arg pro AMB ser pro gin gly arg ala ser arg val val phe ala gly leu ser ala lys 

™?T«2f 9 arg arg 3rg ala gly leU pro ala 3er ser 3er ar 9 val C Y 3 arg gin arg 
1021/341 . 1051/351 * 

ggt gta ggg gta gcg ttc gtg ggc gtc gac gac- gat gtg cag etc ggg gat gec qqc aac 

gly , Va L gly Val 313 Phe Val gly Val asp a3p as P " a l 91" 1- glY £p ala g 9 y lit 
val AMB; gly AMB arg ser trp ala ser thr thr met cys ser ser gly met pro ala ala 

io8 y / 3 £ g gly . ser val arg gly arg atg arg 1 a [ g 3 ^ s ala ala arg g?y cy3 a ° g a - « g 

gcg ggc ggt ggg ggt gcg cac gee egg ccg cga ctg ttt gcg cgt ttt ggg get ctg cca 
ala gly gly gly gly ala his ala arg pro arg leu phe ala arg phe gly ala leu pro 
arg ala val gly val arg thr pro gly arg asp cys leu arg val leu giy leu cys gin 

114V3at g 9ly ^ 3la 3rg Pr ° aU ^un/agf CyS 313 Phe trP 9ly S " ala arg 

nu, m! f 9 9 ? 9 g ?° 9 ? 9 CgC Cat ggt 9tg CdC Cag "9 cga teg gtt etc ccg cgc 
glu his his leu ala ala ala arg his gly val his gin leu arg ser val leu pro arg 
asn thr thr trp arg pro arg ala met val cys thr ser cys asp arg phe ser arc ala 

12^Sf° Pr ° ^ y aCg Pt ° ^ CyS 913 Pt ° Val ala ^ 9ly 3 « P ro aL arg 
' 1231/411 

9 JZ Z-iZ l?Z gaC 9aC 9t f 9at gg ° CgC gCC CCg gcg * ct * ca 9 CC W ta 9 «<= gac ccg 
ala gly gly asp asp val asp gly arg ala pro ala ala ala ala ala AMB leu asp pro 
arg ala ala thr thr ser met ala ala pro arg arg leu gin leu arg ser ser thr aro 

i»£/«£ S 3Eg arg arg atg " P Pr ° arg pr ° gly gly cys 3er c * s vai a l a arg pro gly 
1261/421 1291/431 * 

gtc gac gac gac ggg gtc ggc ggg cca gtc ggc gat gtc gag gcg atg gca ata cag cgc 

ser thr a3 hr a3 L 9 i y ^ i' gly Pr ? Val gly aSp Val glu aia met aia «• arg 
ser thr thr thr gly 3er ala gly gin ser ala met ser arg arg trp gin tyr ser ala 

arg arg arg arg gly arg arg ala ser arg arg cys arg gly asp gly asn thr ala pro 

SEQ ID N° 1SQ (suite 1) 
FIGURE 15Q (suite 1) 



FEUILLE DE REMPLACEMENT (REGLE 26) 



PCT/FR98/01813 



56/185 



1321/441 1351/451 

ctt ggt gcg egg cca cac gtc tga ggt ggc gaa gac cag tec cgc gec cac egg cag ccg 
leu gly ala arg pro his val OPA gly gly glu asp gin ser arg ala his arg gin pro 

leu val arg gly his thr ser glu val ala lys thr ser pro ala pro thr gly ser arg 
trp cys ala ala thr arg leu arg trp arg arg pro val pro arg pro pro ala ala alv 
1381/461 1411/471 * Y 

gat cag gta ggg cag gcg cga gtc ttc age ggg gtt ggc ggc gac gag cag etc cac aga 
asp gin val gly gin ala arg val phe ser gly val gly gly asp glu gin leu his arg 

ile arg AMB gly arg arg glu ser ser ala gly leu ala ala thr ser ser ser thr glu 
ser gly arg ala gly ala ser leu gin arg gly trp arg arg arg ala ala pro gin ser 
1441/481 1471/491 

gtg tga ggg tac ggg egg cgt acg gca acg gtg aag cag gca etc cga cga ace cat cgt 
val OPA gly tyr gly arg arg thr ala thr val lys gin ala leu arg arg thr his arg 
cys glu gly thr gly gly val arg gin arg OPA ser arg his ser asp glu pro ile val 
val arg val arg ala ala tyr gly asn gly glu ala gly thr pro thr asn pro ser ser 
1501/501 

cac gtc gaa ggg gca ggt ga 
his val glu gly ala gly 
thr ser lys gly gin val 
arg arg arg gly arg OPA 



SEQ ID N° 15Q {suite 2) 
FIGURE 15Q (suite {2) 



TGC GCA 


TGC 


CGA 


CCA 


GTG 


TGG 


TTG 


GCC 


GGA 


cys ala 


cys 


arg 


pro 


val 


trp 


leu 


ala 


gly 


61/21 
















CGA TAT 


AAC 


CAC 


TCT 


AGT 


CAC 


ATC 


AAC 


CAC 


arg tyr 


asn 


his 


ser 


ser 


his 


ile 


asn 


his 


121/41 


















CAT GCA 


TTC 


GCG 


ACC 


GCG 


GGA 


GCC 


GGC 


GAA 


his ala 


phe 


ala 


thr 


ala 


gly 


ala 


gly 


glu 


181/61 












GAC TTC 


CGT 


GCC 


GAA 


CCG 


ACG 


CCG 


ACG 


CAA 


asp phe 


arg 


ala 


glu 


pro 


thr 


pro 


thr 


gin 


241/81 
















CCT GGC 


AGT 


TGC 


AAG 


TCC 


TTG 


TGC 


ATA 


TTT 


pro gly 


ser 


cys 


lys 


ser 


leu 


cys 


ile 


phe 


301/101 
















GCG GCC 


CGA 


GCA 


CCA 


TGA 


ATT 


CAA 


GCA 


GGC 


ala ala 


arg 


ala 


pro 


OPA 


ile 


gin 


ala 


gly 


361/121 














GAT GTC 


CGC 


GCT 


ATC 


GCA 


GGG 


GTT 


GTC 


CCA 


asp val 


arg 


ala 


ile 


ala 


gly 


val 


val 


pro 



31/11 

GTT CGT TTG TTC GCG ATT GCC TCA ACG ATT 
val arg leu phe ala ile ala ser thr ile 
91/31 

ACT CGT ACC ATC GAG CGT GTG GGT TCA TGC 
thr arg thr ile glu arg val gly ser cys 
151/51 

CCC GGC GCC ACA CAT AAT CCA GAT TGA GGA 
pro gly ala thr his asn pro asp OPA gly 
211/71 

GCT TTC GAC AGC CAT GAG CGC GGT CGC CGC 
ala phe asp ser his glu arg gly arg arg 
271/91 ^ " 

TCT TGT CTA CGA ATC AAC CGA AAC GAC CGA 
ser cys leu arg ile asn arg asn asp arg 
331/111 

GGC GGT GTT GAC CGA CCT GCC CGG CGA GCT 

gly gly val asp arg pro ala arg arg ala 

391/131 

GTT CGG GAT C 

val arg asp 



SEQ ID N° 16A 
FIGURE 16A 



FEUILLE DE REMPLACEMENT (REGLE 26) 



# 




WO 99/09186 W 

PCT/FR98/01813 

57/185 



GCG CAT 


GCC 


GAC 


CAG 


TGT 


GGT 


ala his 


ala 


asp gin cys 


gly 


62/21 










GAT ATA ACC 


ACT 


CTA 


GTC 


ACA 


asp ile 


thr 


thr 


leu 


val 


thr 


122/41 












ATG CAT 


TCG 


CGA 


CCG 


CGG 


GAG 


met his 


ser 


arg 


pro 


arg 


glu 


182/61 








ACT TCC 


GTG 


CCG 


AAC 


CGA 


CGC 


thr ser 


val 


pro 


asn 


arg 


arg 


242/81 








CTG GCA 


GTT 


GGA AGT 


CCT 


TGT 


leu ala 


val 


ala 


ser 


pro 


cys 


302/101 










CGG CCC 


GAG 


CAC 


CAT 


GAA 


TTC 


arg pro glu 


his 


his glu 


phe 


362/121 










ATG TCC 


GCG 


CTA 


TCG 


CAG 


GGG 


met ser 


ala 


leu ser gin 


gly 



32/11 

TGG CCG GAG TTC GTT TGT 
trp pro glu phe val cys 
92/31 

TCA ACC ACA CTC GTA CCA 
ser thr thr leu val pro 

152/51 
CCG GCG AAC CCG GCG CCA 
pro ala asn pro ala pro 

212/71 
CGA CGC AAG CTT TCG ACA 
arg arg lys leu ser thr 

272/91 
GCA TAT TTT CTT GTC TAC 
ala tyr phe leu val tyr 

332/111 
AAG CAG GCG GCG GTG TTG 
lys gin ala ala val leu 

392/131 
TTG TCC CAG TCC GGG ATC 
leu ser gin phe gly ile 



TCG CGA TTG CCT CAA CGA TTC 
ser arg leu pro gin arg phe 

TCG AGC GTG TGG GTT CAT GCC 
ser ser val trp val his ala 

CAC ATA ATC CAG ATT GAG GAG 
his ile ile gin ile glu glu 

GCC ATG AGC GCG GTC GCC GCC 
ala met ser ala val ala ala 

GAA TCA ACC GAA ACG ACC GAG 
glu ser thr glu thr thr glu 

ACC GAC CTG CCC GGC GAG CTG 
thr asp leu pro gly glu leu 



SEQ ID N° 16B 
FIGURE 16B 



CGC ATG CCG ACC AGT GTG 
arg met pro thr ser val 
63/21 

ATA TAA CCA CTC TAG TCA 
ile OCH pro leu AMB ser 
123/41 

TGC ATT CGC GAC CGC GGG 
cys ile arg asp arg gly 
183/61 

CTT CCG TGC CGA ACC GAC 
leu pro cys arg thr asp 
243/81 

TGG CAG TTG CAA GTC CTT 
trp gin leu gin val leu 
303/101 

GGC CCG AGC ACC ATG AAT 
gly pro ser thr met asn 
363/121 

TGT CCG CGC TAT CGC AGG 
cys pro arg tyr arg arg 











33/11 




GTT 


GGC 


CGG 


AGT 


TCG TTT 


GTT 


val 


gly 


arg 


ser 


ser phe 


val 










93/31 




CAT 


CAA 


CCA 


CAC 


TCG TAC 


CAT 


his 


gin pro 


his 


ser tyr 


his 










153/51 




AGC 


CGG 


CGA 


ACC 


CGG CGC 


CAC 


ser 


arg 


arg 


thr 


arg arg 


his 










213/71 




GCC 


GAC 


GCA 


AGC 


TTT CGA 


CAG 


ala 


asp 


ala 


ser 


phe arg 


gin 










273/91 




GTG 


CAT 


ATT 


TTC 


TTG TCT 


ACG 


val 


his 


ile 


phe 


leu ser 


thr 










333/111 




TCA 


AGC 


AGG 


CGG 


CGG TGT 


TGA 


ser 


ser 


arg 


arg 


arg cys 


OPA 










393/131 




GGT 


TGT 


CCC 


AGT 


TCG GGA 


TC 


gly cys pro 


ser 


ser gly 





CGC GAT TGC CTC AAC GAT TCG 
arg asp cys leu asn asp ser 

CGA GCG TGT GGG TTC ATG CCA 
arg ala cys gly phe met pro 

ACA TAA TCC AGA TTG AGG AGA 
thr OCH ser arg leu arg arg 

CCA TGA GCG CGG TCG CCG CCC 
pro OPA ala arg ser pro pro 

AAT CAA CCG AAA CGA CCG AGC 
asn gin pro lys arg pro ser 

CCG ACC TGC CCG GCG AGC TGA 
pro thr cys pro ala ser OPA 



SEQ ID N° 16C 



FIGURE 16C 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 ^^PCT/FR98/01813 



58/185 



GCG GGC 


CAC 


CGA 


TCA 


GTC 


ala gly 


his 


arg 


ser 


val 


61/21 










GCA GTG 


ACG 


ACA 


CCA 


GCG 


ala val 


thr 


thr 


pro 


ala 


121/41 










GGC TCG 


CCT 


TTT 


TTT 


CAT 


gly ser 


pro 


phe 


phe 


his 


181/61 










TTC GGT 


CAC 


CTG 


ACG 


GTC 


phe gly 


his 


leu 


thr 


val 


241/81 










TGC CCT 


GCT 


GGT 


GCG 


GCG 


cys pro 


ala 


gly 


ala 


ala 


301/101 










GTC GAT 


GGC 


CCT 


CAA 


CTC 


val asp 


gly 


pro 


gin 


leu 



31/11 

GAT CGG GTG GTT TCC GCT CCA 
asp arg val val ser ala pro 
91/31 

CAG GAC GCG CCG TTG GTG TTT 
gin asp ala pro leu val phe 
151/51 

CAA CGT TGG ACT GCC GCA GTG 
gin arg trp thr ala ala val 
211/71 

GGG ATG TTC CTT GGG TCT CGG 
gly met phe leu gly ser arg 
271/91 

TTC GGC CGA GTC GAT CAC CGC 
phe gly arg val asp his arg 

331/111 
GGC ATC GCG ACT GGC GAT TAT 
gly ile ala thr gly asp tyr 



TCA GCC CGG AAT TGA GGT GCC 
ser ala arg asn OPA gly ala 

CCC TCT GTT GCT TTC CCG TCC 
pro ser val ala phe pro ser 

GCG ATG TTG GTC GCC GGC GTG 
ala met leu val ala gly val 

GTT GCT GCT GGG TTT GCT CAA 
val ala ala gly phe ala gin 

CAA AGA GCA CCC GTT AAA ACG 
gin arg ala pro val lys thr 

CAC CAT GCC TCG GGC TGA TC 
his his ala ser gly OPA 



SEQ ID N° 17A 



FIGURE 17A 



CGG GCC 


ACC 


GAT 


arg ala 


thr 


asp 


62/21 






CAG TGA 


CGA 


CAC 


gin OPA 


arg 


his 


122/41 






GCT CGC 


CTT 


TTT 


ala arg 


leu 


phe 


182/61 






TCG GTC 


ACC 


TGA 


ser val 


thr 


OPA 


242/81 






GCC CTG 


CTG 


GTG 


ala leu 


leu 


val 


302/101 






TCG ATG 


GCC 


CTC 


ser met 


ala 


leu 



CAG 


TCG 


ATC 


GGG 


gin 


ser 


ile 


gly 


CAG 


CGC 


AGG 


ACG 


gin 


arg 


arg 


thr 


TTC 


ATC 


AAC 


GTT 


phe 


ile 


asn 


val 


CGG 


TCG 


GGA TGT 


arg 


ser 


gly cys 


CGG 


CGT 


TCG 


GCC 


arg 


arg 


ser 


ala 


AAC 


TCG 


GCA 


TCG 


asn 


ser 


ala 


ser 







32/11 


TGG 


TTT 


CCG CTC 


trp 


phe 


pro leu 






92/31 


CGC 


CGT 


TGG TGT 


arg 


arg 


trp cys 






152/51 


GGA 


CTG 


CCG CAG 


gly 


leu 


pro gin 






212/71 


TCC 


TTG 


GGT CTC 


ser 


leu 


gly leu 






272/91 


GAG 


TCG 


ATC ACC 


glu 


ser 


ile thr 






332/111 


CGA 


CTG 


GCG ATT 


arg 


leu 


ala ile 



CAT CAG CCC GGA 
his gin pro gly 

TTC CCT CTG TTG 
phe pro leu leu 

TGG CGA TGT TGG 
trp arg cys trp 

GGG TTG CTG CTG 
gly leu leu leu 

GCC AAA GAG CAC 
ala lys glu his 

ATC ACC ATG CCT 
ile thr met pro 



ATT GAG GTG CCG 
ile glu val pro 

CTT TCC CGT CCG 
leu ser arg pro 

TCG CCG GCG TGT 
ser pro ala cys 

GGT TTG CTC AAT 
gly leu leu asn 

CCG TTA PJKA CGG 
pro leu lys arg 

CGG GCT GAT C 
arg ala asp 



SEQ ID N° 17B 



FIGURE 17B 



FEUILLE DE REPLACEMENT (REGLE 26) 



^^PCT/FR98/01813 



59/185 



33/11 



GGG CCA 


CCG 


ATC 


AGT 


CGA TCG 


GGT 


GGT 


TTC 


CGC TCC 


ATC 


AGC 


CCG 


GAA 


TTG 


AGG 


TGC 


VOL. 


gly pro 


pro 


ile 


ser 


arg ser 


gly gly phe 


arg ser 


ile 


ser 


pro glu 


leu 


arc 


CVS 


arg 


63/21 
















93/31 












AGT GAC 


GAC 


ACC 


AGC 


GCA GGA 


CGC 


GCC 


GTT 


GGT GTT 


TCC 


CTC 


TGT 


TGC 


TTT 


CCC 


GTC 


CGG 


ser asp 


asp 


thr 


ser 


ala gly 


arg 


ala 


val 


gly val 


ser 


leu 


cys 


cys 


phe 


pro 


val 


arg 


123/41 
















153/51 










CTC GCC 


TTT 


TTT 


TCA 


TCA ACG 


TTG 


GAC 


TGC 


CGC AGT 


GGC 


GAT 


GTT 


GGT 


CGC 


CGG 


CGT 


GTT 


leu ala 


phe 


phe 


ser 


ser thr 


leu 


asp 


cys 


arg ser 


gly 


asp 


val 


gly 


arg 


arg 


arg 


val 


183/61 
















213/71 












CGG TCA 


CCT 


GAC 


GGT 


CGG GAT 


GTT 


CCT 


TGG 


GTC TCG 


GGT 


TGC 


TGC 


TGG 


GTT 


TGC 


TCA 


ATG 


arg ser 


pro 


asp 


gly 


arg asp 


val 


pro 


trp 


val ser 


gly cys 


cys 


trp 


val 


cys 


ser 


met 


243/81 
















273/91 














CCC TGC 


TGG 


TGC 


GGC 


GTT CGG 


CCG 


AGT 


CGA 


TCA CCG 


CCA AAG 


AGC 


ACC 


CGT 


TAA 


AAC 


GGT 


pro cys 


trp 


cys 


gly 


val arg 


pro 


ser 


arg 


ser pro 


pro 


lys 


ser 


thr 


arg 


OCH 


asn 


gly 


303/101 
















333/111 














CGA TGG 


CCC 


TCA 


ACT 


CGG CAT 


CGC 


GAC 


TGG 


CGA TTA 


TCA 


CCA 


TGC 


CTC 


GGG 


CTG 


ATC 




arg trp 


pro 


ser 


thr 


arg his 


arg 


asp 


trp 


arg leu 


ser 


pro 


cys 


leu 


gly 


leu 


ile 





SEQ ID N° 17C 
FIGURE 17C 



partie de la sequence nucleotidique de seq!7A 

1/1 ' 31/11 

ggc tag aac ccc gaa gga gac etc gcg ggt tgc egg ccc ccg gec cat egg atg cgt ate 

gly AMB asn pro glu gly asp leu ala gly cys arg pro pro ala his arg met arg ile 

61/21 91/31 

egg teg cgc cga ttc acg ace gac ata ggg age cac ccc ttg ggt gat tec ggt gcg acg 

arg ser arg arg phe thr thr asp ile gly ser tyr oro leu gly asp ser gly ala thr 

121/41 151/51 

act gcg ata cgc teg gcg ggc cac cga tea gtc gat: egg gtg gtt tec get cca tea gee 

thr ala ile arg ser ala gly his arg ser val aso arg val val ser ala pro ser ala 

181/61 211/71 

egg aat tga ggt gec gca gtg acg aca cca gcg cag gac gcg ccg ttg gtg ttt ccc tct 

arg asn OPA gly ala ala val thr thr pro ala gin asp ala pro leu val phe pro ser 

241/81 271/91 

gtt get ttc cgt ccg gtt cgc ctt ttt ttc ate aac gtt gga ctg gee gca gtg gcg atg 

val ala phe arg pro val arg leu phe phe ile asn val gly leu ala ala val ala met 

301/101 331/111 

ttg gtc gee ggc gtg ttc ggt cac ctg acg gtc ggg atg ttc ttg ggt etc ggg ttg ctg 

leu val ala gly val phe gly his leu thr val gly met one leu gly leu gly leu leu 

361/121 391/131 

ctg ggt ttg etc aat gec ctg ctg gtg egg cgt teg gee gag teg ate ace gec aaa gag 

leu gly leu leu asn ala leu leu val arg arg ser ala glu ser ile thr ala lys qlu 

421/141 451/151 

cac ccg tta aaa egg teg atg gec etc aac teg gca teg cga ctg gcg att ate acc ate 

his pro leu lys arg ser met ala leu asn ser ala ser arg leu ala ile ile th- ile 
481/161 

etc ggg ctg ate 

leu gly leu ile 

SEQ ID N° 17A' 
FEUILLE DE REMptSHISlE^REGLE 26) 




WO 99/09186 ^If ^^PCT/FR98/01813 

60/185 



1/1 

get aga acc ccg aag 
ala arg thr pro lys 
61/21 

ggt cgc gec gat tea 
gly arg ala asp ser 
121/41 

ctg cga tac get egg 
leu arg tyr ala arg 
161/61 

gga att gag gtg ccg 
gly ile glu val pro 
241/81 

ttg ctt tec gtc egg 
leu leu ser val arg 
301/101 

tgg teg ccg gcg tgt 
trp ser pro ala cys 
361/121 

tgg gtt tgc tea atg 
trp val cys ser met 
421/141 

ace cgt taa aac ggt 
thr arg OCH asn gly 
481/161 

teg ggc tga tc 
ser gly CPA 



gag acc teg egg gtt 
glu thr ser arg val 

cga ccg aca tag gga 
arg pro thr AMB gly 

egg gec acc gat cag 
arg ala thr asp gin 

cag tga cga cac cag 
gin OPA arg his gin 

ttc gec ttt ttt tea 
phe ala phe phe ser 

teg gtc acc tga egg 
ser val thr OPA arg 

ccc tgc tgg tgc ggc 
pro cys trp cys gly 

cga tgg ccc tea act 
arg trp pro ser thr 



31/11 








gec ggc 


ccc 


egg 


ccc 


ala gly 


pro 


arg 


pro 


91/31 








get acc 


cct 


tgg 


gtg 


ala thr 


pro trp 


val 


15 1/5 1 








teg ate 


ggg 


tgg 


ttt 


ser ile 


gly trp 


phe 


211/71 








cgc agg 


acg 


cgc 


cgt 


arg arg 


thr 


arg 


arg 


271/91 






tea acg 


ttg 


gac 


tgg 


ser thr 


leu 


asp 


trp 


331/111 








teg gga 


tgt 


tct 


tgg 


ser gly 


cys 


ser 


trp 


391/131 








gtt egg 


ccg 


agt 


cga 


val arg 


pro 


ser 


arg 


451/151 








egg cat 


cgc 


gac 


tgg 


arg his 


arg 


asp 


trp 



ate gga tgc gta tec 
ile gly cys val ser 

att ccg gtg cga cga 
ile pro val arg arg 

ccg etc cat cag ccc 
pro leu his gin pro 

tgg tgt ttc cct ctg 
trp cys phe pro leu 

ccg cag tgg cga tgt 
pro gin trp arg cys 

gtc teg ggt tgc tgc 
val ser gly cys cys 

tea ccg cca aag age 
ser pro pro lys ser 

cga tta tea cca tec 
arg leu ser pro ser 



SEQ ID N° 17B' 
FIGURE 17B" 



1/1 

eta gaa ccc cga agg aga cct cgc ggg ttg 
leu glu pro arg arg arg pro arg gly leu 
61/21 

gtc gcg ccg att cac gac cga cat agg gag 
val ala pro ile his asp arg hi 3 arg glu 
121/41 

tgc gat acg etc ggc ggg cca ccg ate agt 
cys asp thr leu gly gly pro pro ile ser 
181/61 

gaa ttg agg tgc cgc agt gac gac ace age 
glu leu arg cys arg ser asp asp thr ser 
241/81 

tgc ttt ccg tec ggt teg cct ttt ttt cat 
cys phe pro ser gly ser pro phe phe his 
301/101 

ggt cgc egg cgt gtt egg tea cct gac ggt 
gly arg arg arg val arg ser pro asp gly 
361/121 

ggg ttt get caa tgc cct get ggt gcg gcg 
gly phe ala gin cys pro ala gly ala ala 
421/141 

ccc gtt aaa acg gtc gat ggc cct caa etc 

pro val lys thr val asp gly pro gin leu 

491/161 

egg get gat c 

arg ala asp 



31/11 

ccg gec ccc ggc cca teg gat gcg tat ccg 
pro ala pro gly pro ser asp ala tyr pro 
91/31 

eta ccc ctt ggg tga ttc egg tgc gac gac 
leu pro leu gly OPA phe arg cys asp asp 
151/51 

cga teg ggt ggt ttc cgc tec ate age ccg 
arg ser gly gly phe arg ser ile ser pro 
211/71 

gca gga cgc gec gtt ggt gtt tec etc tgt 
ala gly arg ala val gly val ser leu cys 
271/91 

caa cgt tgg act ggc cgc agt ggc gat gtt 
gin arg trp thr gly arg ser gly asp val 
331/111 

egg gat gtt ctt ggg tct egg gtt get get 
arg asp val leu gly ser arg val ala ala 
391/131 

ttc ggc cga gtc gat cac cgc caa aga gca 
phe gly arg val asp his arg gin arg ala 
451/151 

ggc ate gcg act ggc gat tat cac cat cct 
gly ile ala thr gly asp tyr his his pro 



SEQ ID N° 17C 



FEUILLE DE REMRt&fiSMBN£ (REGLE 26) 



WO 99/09186 ^^PCT/FR98/01813 

61/185 

sequence Rvl303 predite par Cole et al. (Nature 393:537-544) et contenanc partiellement 
M 31/11 

atg acg aca cca gcg cag gac gcg ccg ttg gtg ttt ccc tct gtt get ttc cot ceo ott 
met^thr thr pro ala gin asp ala pro leu valine pro ser val Ila phe arg pro val 

tit ?" 'f* ^ C ?, tC aaC 9 " 9ga ctg gcc gca 9tg gcg atg ttg gtc gec ggc gtg etc 
"f/Jr Phe PhS Ue aSn Val gly leu ala Hi ^al ala mel leu val Ila gly val phe 

ggt cac ctg acg gtc ggg atg ttc ttg ggt etc ggg ttg ctg ctg got tto etc aat «v 
gly^his leu thr val gly met phe leu gly leu leu leu leu gly l"u leu asn Ha 

ctg ctg gtg egg cgt teg gec gag teg ate acc gec aaa gag cac ccg tta aaa coo tea 
leu Uu val arg arg ser ala glu aer ile thr^ala lya glu his pro leu l? s arg ser 

atg gee etc aac teg gca teg cga ctg gcg att ate acc ate etc ggg ctg ate ate acc 
Tullt Mn " g l6U SlWt tht ile leu 2! leu ile Ue E 

tac att ttc egg ccc get gga ttg ggc gtc gtg ttc ggg ctg gca ttc ttc can „r« ,-f-„ 
tyr lie phe arg pro ala gly ieu gly val ?a? phe Ty leu al" phe J£ gin va? ^eu 
JO " 1 ' 1 391/131 

ctg gtg gca acg acg gee ctg ccg gtc ctg aag aag ctg cgc act gcg acc gag gaa cca 
«mS ^ 3la 1SU Pr ° Val leu leu « g ^r III tnr III Jlu 

5a? ^ tCt tCC 3aC gg ° Cag aCC ggg gga tc 9 aaa 9^ agg age gee age gat 

m/S? yt 3er s " asn 9ly 9ln thr 9ly gly ser glu gl * " g 3 « «J 



481/161 
gac tga 
asp OPA 

SEQ ID N° 17D 
FIGURE 17D 

Orf d'apres Cole et al. (Nature 393:537-544) et contenant Rvl303 
1/1 31/11 

tga ggt gee gca gtg acg aca cca gcg cag gac gcg ccg ttg gtg ttc ccc tct att act 
H%? y ala ala val «=hr thr pro ala gin asp^ala pro leu val' phe pro ser val lit 

ttc cgt ccg gtt cgc ctt ttt ttc ate aac gtt gga ctg gec gca gtg gcg atg ccg gtc 
phe^arg pro val arg leu phe phe ile asn val gly leu ala ala val 111 L? leu Sal 

151/ S 1 
atg ttc 
met phe 
211/71 
gee gac 
ala gli 
271/91 

leu lvs 111 III VI g ?° tCg tCg Cga Ctg gCg att atc acc ^e etc ggg 

30moi 9 ' aSn 318 HI/HI leU ala ile ile «=hr ile leu gly 

ieu lit ut g f c ^ ac a r cgg ccc gct gga ttg ggc gtc gc g "«= ggg ctg gca ttc 

SwS! aCg Pr ° 313 gj,J™ gly val val <> h * g? ^ 1« K She 

tec cag gtg ctg ctg gcg gca acg acg gec cCg ccg gtc ctg aag aag ccg cgc acc gca 
421/?U ^ UU Wl thr 313 Val le ' le » "9 thr ala 

acc gag gaa ccg gee gca acC cac ccc Ccc aac ggc cag acc ggg gga Ccg aaa aaa a™ 

m/S? 9 pro val ala thr tyr 3er se£ asn gly gl " thr S3 ffi 2 gaa agg 

age gec age gac gac tga 
ser ala ser asp asp opa 



151/51 

gec ggc gtg ttc ggt cac ctg acg gtc ggg atg ttc ttg ggt etc ggg ttg ctg ctg aac 
aU gly val phe gly his leu thr val gly met^phe leu gly leu g?? leu leu leu g? y 

HI ttu asn ala ?!* f 9 ^ C " Cgt tCg 9CC gag tCg atC acc gcc aaa gag cac ccg 
\il/\T arg arg S 3 , 91 " 36r 116 thr aXa l *» g 1 " ^s pro 



SEQ ID N" 17F 



FEU1LLE DE REB«q<«OBWlBiqT(REGLE 26) 



WO 99/09186 ^^PCT/FR98/01813 



62/185 



31/11 

GTC GAA CAG GTA CGG AAG GCG CCG TCG GTC GCT CGG TCC GCT GGT ATC TCG TGT TCA GCC 
val glu gin val arg lys ala pro ser val ala arg ser ala gly ile ser cys ser ala 
61/21 91/31 

AGC CAG CGG CCG TTA ACG TGG CCG AAC AGG TCG TCT TGG GGT CGG GCA TCA GCG TCG ATG 
ser gin arg pro leu thr trp pro asn arg ser ser trp gly arg ala ser ala ser met 
121/41 151/51 

TGG CTC AGG TCG ATA CCC GAG GGG ATG GCA AGT GTC ACC CCG CCA TCC TTC CAC CTC TTT 
trp leu arg ser ile pro glu gly met ala ser val thr pro pro ser phe his leu phe 
181/61 211/71 

TCG GGT GCA ACG ATC GGG CCA TGC CTG ACG GGG AGC AGA GCC AGC CAC CGG CCC AAG AAG 
ser gly ala thr ile gly pro cys leu thr gly ser arg ala ser his arg pro lys lys 
241/81 271/91 

ATG CGG AAG ACG ACT CGC GGC CCG ACG CCG CGG AGG CCG CCG CGG CCG AAC CCA AAT CAT 
met arg lys thr thr arg gly pro thr pro arg arg pro pro arg pro asn pro asn his 
301/101 331/111 

CAG CCG GTC CCG ATG TTC TCG ACC TAG GGT ATC GCC TCG ACA CTA CTC GGC GTG CTA TCG 
gin pro val pro met phe ser thr tyr gly ile ala ser thr leu leu gly val leu ser 
361/121 

GTC GCC GCG GTC GTG CTG GGT GCG ATG ATC 
val ala ala val val leu gly ala met ile 



SEQ ID N° 18A 
FIGURE 18A 



TCG AAC 


AGG 


TAC 


GGA 


ser asn 


arg 


tyr gly 


62/21 








GCC AGC 


GGC 


CGT 


TAA 


ala ser 


gly 


arg 


OCH 


122/41 








GGC TCA 


GGT 


CGA 


TAC 


gly ser 


gly 


arg 


tyr 


182/61 








CGG GTG 


CAA 


CGA 


TCG 


arg val 


gin 


arg 


ser 


242/81 








TGC GGA 


AGA 


CGA 


CTC 


cys gly 


arg 


arg 


leu 


302/101 








AGC CGG 


TCC 


CGA 


TGT 


ser arg 


ser 


arg 


cys 


362/121 








TCG CCG 


CGG 


TCG 


TGC 


ser pro 


arg 


ser 


cys 



AGG 
arg 


CGC 
arg 


CGT CGG 
arg arg 


TCG 
ser 


CGT 
arg 


GGC CGA ACA 
gly arg thr 


GGT 
gly 


CCG 
pro 


AGG GGA TGG 
arg gly trp 


CAA 
gin 


GGC 
gly 


CAT 
his 


GCC TGA 
ala OPA 


CGG 
arg 


GCG 
ala 


GCC 
ala 


CGA CGC 
arg arg 


CGC 
arg 


TCT 
ser 


CGA 
arg 


CCT ACG 
pro thr 


GTA 
val 


TGG 
trp 


GTG 
val 


CGA TGA 
arg OPA 


TC 



32/11 

CTC GGT CCG CTG GTA 
leu gly pro leu val 
92/31 

CGT CTT GGG GTC GGG 
arg leu gly val gly 
152/51 

GTG TCA CCC CGC CAT 
val ser pro arg his 
212/71 

GGA GCA GAG CCA GCC 
gly ala glu pro ala 
272/91 

GGA GGC CGC CGC GGC 
gly gly arg arg gly 
332/111 

TCG CCT CGA CAC TAC 
ser pro arg his tyr 



TCT CGT GTT CAG CCA 
ser arg val gin pro 

CAT CAG CGT CGA TGT 
his gin arg arg cys 

CCT TCC ACC TCT TTT 
pro ser thr ser phe 

ACC GGC CCA AGA AGA 
thr gly pro arg arg 

CGA ACC CAA ATC ATC 
arg thr gin ile ile 

TCG GCG TGC TAT CGG 
ser ala cys tyr arg 



SEQ ID N° 18B 



FIGURE 18B 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 




CT/FR98/01813 



63/185 



3/1 














CGA ACA 


GGT 


ACG 


GAA 


GGC 


GCC 


GTC GGT CGC 


arg thr 


gly 


thr 


glu 


gly 


ala 


val gly arg 


63/21 












CCA GCG 


GCC 


GTT 


AAC 


GTG 


GCC 


GAA CAG GTC 


pro ala 


ala 


val 


asn 


val 


ala glu gin val 


123/41 














GCT CAG 


GTC 


GAT 


ACC 


CGA 


GGG 


GAT GGC AAG 


ala gin 


val 


asp 


thr 


arg 


gly asp gly lys 


183/61 














GGG TGC 


AAC 


GAT 


CGG 


GCC 


ATG 


CCT GAC GGG 


gly cys 


asn 


asp 


arg 


ala 


met 


pro asp gly 


243/81 












GCG GAA 


GAC 


GAC 


TCG 


CGG 


CCC 


GAC GCC GCG 


ala glu 


asp 


asp 


ser 


arg 


pro 


asp ala ala 


303/101 












GCC GGT 


ccc 


GAT 


GTT 


CTC 


GAC 


CTA CGG TAT 


ala gly 


pro 


asp 


val 


leu 


asp 


leu arg tyr 


363/121 












CGC CGC 


GGT 


CGT 


GCT 


GGG 


TGC 


GAT GAT C 


arg arg 


gly 


arg 


ala 


gly 


cys 


asp asp 



33/11 

TCG GTC CGC TGG TAT CTC GTG TTC AGC CAG 

93/31 31 82:9 9in 
GTC TTG GGG TCG GGC ATC AGC GTC GAT GTG 
val leu gly ser gly ile ser val asp val 
153/51 

TGT CAC CCC GCC ATC CTT CCA CCT CTT TTC 
cys his pro ala ile leu pro pro leu phe 
213/71 

GAG CAG AGC CAG CCA CCG GCC CAA GAA GAT 
glu gin ser gin pro pro ala gin glu asp 
273/91 * 
GAG GCC GCC GCG GCC GAA CCC AAA TCA TCA 
glu ala ala ala ala glu pro lys ser ser 
333/111 

CGC CTC GAC ACT ACT CGG CGT GCT ATC GGT 
arg leu asp thr thr arg arg ala ile gly 



SEQ ID N° 18C 



FIGURE 18C 



partie de la sequence nucleotidique de seol3A 
1/1 ' ' 31/11 

GAA GGC GCC GTC GGT CGC TCG GTC CGC TGG TAT CTC GTG TTC AGC CAG CCA GCG GCC GTT 
g u gly ala val gly arg ser val arg trp tyr leu val phe ser gin P S£ S 5 val 
oi/^i 91/31 

AAC GTG GCC GAA CAG GTC GTC TTG GGG TCG GGC ATC AGC GTC GAT GTG GCT CAG GTC GAT 
tll/Tl 9 9 9lY Hi,?* Ser Val as P val ala 9ln val asp 

i£ a- Tit T f G TGT ^ C CCC GCC ^'cTT CCA CCT CTT TTC GGG TGC AAC GAT 

? B ul? 9 y p 9 y lys cys hls pro ala ile leu P ro leu P he gly <=ys «»« aSD 

1B1/61 211/71 

CGG GCC ATG CCT GAC GGG GAG CAG AGC CAG CCA CCG GCC CAA GAA GAT GCG GAA GAC GAC 

£?/£ pco asp 9 y 9 9ln ser 9ln P " p " ala gln glu as p aia 3 iu "p *»p 

TCG CGG CCC GAC GCC GCG GAG GCC GCC GCG GCC GAA CCC AAA TCA TCA GCC GGT CCG ATG 

ill/ill pto asp ala ala glu ala ala aia gj/S; pro lys ser ser ala gly pco ^ 

TTC TCG ACC TAC GGT ATC GCC TCG ACA CTA CT^GGC GTG CTA TCG GTC GCC GCG GTC GTG 
Phaser thr tyr gly ile ala ser thr leu leu gly val leu ser val ala ala Vtl 

CTG GGT GCG ATG ATC 
leu gly ala met ile 



SEQ ID N° 18A 1 
FIGURE 18A' 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



64/185 



1/1 

CGG AAG GCG CCG TCG GTC GCT 
arg lys ala pro ser val ala 
61/21 

TTA ACG TGG CCG AAC AGG TCG 
leu thr trp pro asn arg ser 
121/41 

ATA CCC GAG GGG ATG GCA AGT 
ile pro glu gly met ala ser 
181/61 

ATC GGG CCA TGC CTG ACG GGG 
ile gly pro cys leu thr gly 
241/81 

ACT CGC GGC CCG ACG CCG CGG 
thr arg gly pro thr pro arg 
301/101 

TGT TCT CGA CCT ACG GTA TCG 
cys ser arg pro thr val ser 
361/121 

TGC TGG GTG CGA TGA TC 
cys trp val arg OPA 









31/11 




CGG 






GGT ATC 


TCG 


arg 


ser 


ala 


gly ile 


ser 








91/31 




TCT 


TGG 


GGT 


CGG GCA 


TCA 


ser 


trp 


gly 


arg ala 


ser 








151/51 




GTC 


ACC 


CCG 


CCA TCC 


TTC 


val 


thr 


pro 


pro ser phe 








211/71 




AGC 


AGA 


GCC 


AGC CAC 


CGG 


ser 


arg 


ala 


ser his 


arg 








271/91 


AGG 


CCG 


CCG 


CGG CCG 


AAC 


arg 


pro 


pro 


arg pro 


asn 








331/111 




CCT 


CGA 


CAC 


TAC TCG 


GCG 


pro 


arg 


his 


tyr ser 


ala 



SEQ ID N° 18B' 
FIGURE 18B' 



TGT TCA GCC AGC CAG CGG CCG 
cys ser ala ser gin arg pro 

GCG TCG ATG TGG CTC AGG TCG 
ala ser met trp leu arg ser 

CAC CTC TTT TCG GGT GCA ACG 
his leu phe ser gly ala thr 

CCC AAG AAG ATG CGG AAG ACG 
pro lys lys met arg lys thr 

CCA AAT CAT CAG CCG GTC CGA 
pro asn his gin pro val arg 

TGC TAT CGG TCG CCG CGG TCG 
cys tyr arg ser pro arg ser 



1/1 

GGA AGG CGC CGT CGG TCG CTC 
gly arg arg arg arg ser leu 
61/21 

TAA CGT GGC CGA AGA GGT CGT 
OCH arg gly arg thr gly arg 
121/41 

TAC CCG AGG GGA TGG CAA GTG 
tyr pro arg gly trp gin val 
181/61 

TCG GGC CAT GCC TGA CGG GGA 
ser gly his ala OPA arg gly 
241/81 

CTC GCG GCC CGA CGC CGC GGA 
leu ala ala arg arg arg gly 
301/101 

GTT CTC GAC CTA CGG TAT CGC 
val leu asp leu arg tyr arg 
361/121 

GCT GGG TGC GAT GAT C 
ala gly cys asp asp 



31/11 

GGT CCG CTG GTA TCT CGT 
gly pro leu val ser arg 
91/31 

CTT GGG GTC GGG CAT CAG 
leu gly val gly his gin 
151/51 

TCA CCC CGC CAT CCT TCC 
ser pro arg his pro ser 

211/71 
GCA GAG CCA GCC ACC GGC 
ala glu pro ala thr gly 

271/91 

GGC CGC CGC GGC CGA ACC 
gly arg arg gly arg thr 

331/111 
CTC GAC ACT ACT CGG CGT 
leu asp thr thr arg arg 



GTT CAG CCA GCC AGC GGC CGT 
val gin pro ala ser gly arg 

CGT CGA TGT GGC TCA GGT CGA 
arg arg cys gly ser gly arg 

ACC TCT TTT CGG GTG CAA CGA 
thr ser phe arg val gin arg 

CCA AGA AGA TGC GGA AGA CGA 
pro arg arg cys gly arg arg 

CAA ATC ATC AGC CGG TCC GAT 
gin ile ile ser arg ser asp 

GCT ATC GGT CGC CGC GGT CGT 
ala ile gly arg arg gly arg 



SEQ ID N° 18C 
FIGURE 18C 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 




:T/FR98/01813 



65/185 



sequence Rv0199 predite par Cole et al . {Nature 393:537-544) et contenant 
seql8A' 

1/1 31/11 
atg cct gac ggg gag cag age cag cca ccg gec caa < 
Met pro asp gly glu gin ser gin pro pro ala gin < 
61/21 91/31 
ccc gac gec gcg gag gec gec gcg gec gaa ccc aaa i 
pro asp ala ala glu ala ala ala ala glu pro lys • 
121/41 151/51 
acc tac ggt ate gec teg aca eta etc ggc gtg eta i 
thr tyr gly ile ala ser thr leu leu gly val leu i 
181/61 211/71 
gcg atg ate tgg tec gca cac cgc gat gac tec ggc < 
ala met ile trp ser ala his arg asp asp ser gly < 
241/81 271/91 
atg ctg acc gee get gaa tgg acg gec gtg ctg ate < 
met leu thr ala ala glu trp thr ala val leu ile i 
301/101 331/111 
gee age ctg cag cga ctg cac gac gga acg gtc ggt < 
ala ser leu gin arg leu his asp gly thr val alv < 
361/121 391/131 
gtc gtg cag ccc tac egg cag gtg gtg gag aag ttg < 
val val gin pro tyr arg gin val val glu lys leu < 
421/141 451/151 
gag gcg gta gcg ate gat acg gtg cac cgc gag ctg c 
glu ala val ala ile asp thr val his arg glu leu i 
481/161 . 511/m 

ccg gta gta acc acg aaa ttg cca ccg ttt gec act < 
pro val val thr thr lys leu pro pro phe ala thr < 
541/181 571/191 
gcg acg teg gtc agt gag aac gec ggc gee aaa ccc c 
ala thr ser val ser glu asn ala gly ala lys pro c 
601/201 6 y 31 / 211 ' 



gat gcg 
asp ala 


gaa 
glu 


gac gac teg 
asp asp ser 


egg 
arg 


tea 
ser 


gec 
ala 


ggt 
gly 


ccg atg ttc 
pro met phe 


teg 
ser 


gtc gec gcg 
val ala ala 


gtc gtg ctg 
val val leu 


ggt 
gly 


cgt acc 
arg thr 


tac 
tyr 


ctg acc egg 
leu thr arg 


gtc 
val 


atg 

met 


aac 
asn 


gec 
ala 


gac aac ate 
asp asn ile 


gat 
asp 


etc 
leu 


aac 
asn 


acc 
thr 


gac ttc gac 
asp phe asp 


get 
ala 


acg 
thr 


cac 
his 


age 
ser 


age ggc agg 
ser gly arg 


ate 
ile 


acc cag 
thr gin 


tec 
ser 


ggt gee gee 
gly ala ala 


cga 
arg 


acc 
thr 


gac 
asp 


teg 
ser 


gtg ctg ctg 
val leu leu 


gtc 
val 


acc 
thr 


gtg 
val 


cac 
his 


tgg aac ttg 
trp asn leu 


egg 
arg 


egg 
arg 


ttg gag 
leu glu 


teg att cga 
ser ile arg 


tga 
OPA 



SEQ ID N° 18D 
FIGURE 18D 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 




'CT/FR98/01813 



66/185 



ORF d'apres Cole et al. (Nature 393:537-544) et contenant Rv0199 
1/1 31/U 

taa tec gat gcc gga ttg ggt gaa atg cac caa gta acg ggt cga gtc ttt gga ate ggt 
OCH ser asp ala gly leu gly glu met his gin val thr gly arg val phe gly ile gly 
61/21 91/31 

ate gac ata gac tec gat gcc gcc gcc cac gcc ggc acg ttg cag agt gcc aag ggc ggc 
ile asp ile asp ser asp ala ala ala his ala gly thr leu gin ser ala lys qly gly 
121/41 151/51 

ggc caa ttc ggt ggc gtc ggc cgc get gtc aat cgt ggc caa ttc gtc gtg cag egg ttg 
gly gin phe gly gly val gly arg ala val asn arg gly gin phe val val gin arg leu 
181/61 211/71 

cac ccc tgc gcg etc gac ggc ttc etc gtc gag gaa get ggc gta gag gtc gcc gat gcg 
his pro cys ala leu asp gly phe leu val glu glu ala gly val glu val ala asp ala 
241/81 271/91 

ctg cgc ate ggt gcc tac cgc age acc tgc ttg get ggc ctg gat gat cag gtc teg cac 
leu arg ile gly ala tyr arg ser thr cys leu ala gly leu asp asp gin val ser his 
301/101 331/111 

ttg tgt etc ggc gcg gtc gaa cag get acg gaa ggc gcc gtc ggt cgc teg gtc cgc tgg 
leu cys leu gly ala val glu gin ala thr glu gly ala val gly arg ser val arg trp 
361/121 391/131 * 

tat etc gtg ttc age cag cca gcg gcc gtt aac gtg gcc gaa cag gtc gtc ttg ggg teg 
tyr leu val phe ser gin pro ala ala val asn val ala glu gin val val leu gly ser 
421/141 451/151 

ggc ate age gtc gat gtg get cag gtc gat acc cga ggg gat ggc aag tgt cac ccc gcc 
gly ile ser val asp val ala gin val asp thr arg gly asp gly lys cys his pro ala 
481/161 511/171 

ate ctt cca cct ctt ttc ggg tgc aac gat egg gcc atg cct gac ggg gag cag age cag 
ile leu pro pro leu phe gly cys asn asp arg ala met pro asp gly glu gin ser gin 
541/181 571/191 

cca ccg gcc caa gaa gat gcg gaa gac gac teg egg ccc gac gcc gcg gag gcc gcc gcg 
pro pro ala gin glu asp ala glu asp asp ser arg pro asp ala ala glu ala ala ala 
601/201 631/211 

gcc gaa ccc aaa tea tea gcc ggt ccg atg ttc teg acc tac ggt ate gcc teg aca eta 
ala glu pro lys ser ser ala gly pro met phe ser thr tyr gly ile ala ser thr leu 
661/221 691/231 

etc ggc gtg eta teg gtc gcc gcg gtc gtg ctg ggt gcg atg ate tgg tec gca cac cgc 
leu gly val leu ser val ala ala val val leu gly ala met ile trp ser ala his arg 
721/241 751/251 

gat gac tec ggc gag cgt acc tac ctg acc egg gtc atg ctg acc gcc get gaa tgg acg 
asp asp ser gly glu arg thr tyr leu thr arg val met leu thr ala ala glu trp thr 
781/261 811/271 

gcc gtg ctg ate aac atg aac gcc gac aac ate gat gcc age ctg cag cga ctg cac gac 
ala val leu ile asn met asn ala asp asn ile asp ala ser leu gin arg leu his asp 
841/281 871/291 

gga acg gtc ggt caa etc aac acc gac ttc gac get gtc gtg cag ccc tac egg cag gtg 
gly thr val gly gin leu asn thr asp phe asp ala val val gin pro tyr arg gin val 
901/301 931/311 

gtg gag aag ttg egg acg cac age age ggc agg ate gag gcg gta gcg ate gat acg gtg 
val glu lys leu arg thr his ser ser gly arg ile glu ala val ala ile asp thr val 
961/321 991/331 

cac cgc gag ctg gat acc cag tec ggt gcc gcc cga ccg gta gta acc acg aaa ttg cca 
his arg glu leu asp thr gin ser gly ala ala arg pro val val thr thr lys leu pro 
1021/341 1051/351 P 

ccg ttt gcc act cgc acc gac teg gtg ctg ctg gtc gcg acg teg gtc agt gag aac gcc 
pro phe ala thr arg thr asp ser val leu leu val ala thr ser val ser glu asn ala 
1081/361 1111/371 

ggc gcc aaa ccc cag acc gtg cac tgg aac ttg egg etc gat gtc tec gat gtg gac ggc 
gly ala lys pro gin thr val his trp asn leu arg leu asp val ser aso val aso olv 
1141/381 1171/391 ' 

aag ctg atg ate tec egg ttg gag teg att cga tga 
lys leu met ile ser arg leu glu ser ile arg OPA 

SEQ ID N° 18F 



FIGURE 18F 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 




T/FR98/018I3 



67/185 



31/11 

GTT GCG CAA CGG GGT GAG CAC CGA CGC GAT GAT GGC GCA ACT ATC GAA ACT GCA GGA CAT 
val ala gin arg gly glu his arg arg asp a 3 p gly ala thr ile glu thr ala gly his 
bl/21 91/31 

CGC CAA CGC CAA CGA CGG CAC TCG CGC GGT GGG CAC CCC TGG CTA TCA GGC CAG CGT CGA 

gln atg ar9 hiS Ser arg gly gly his P ro tr P leu ser 5ly gin arg arg 
121/41 151/51 

CTA TGT GGT AAA CAC ACT GCG CAA CAG CGG TTT TGA TGT GCA AAC CCC GGA GTT CTC CGC 
leu cys gly lys his thr ala gln gin arg phe CPA cys ala ash pro gly val leu arg 
181/61 211/71 * 

TCG CGT GTT CAA GGC CGA AAA AGG GGT GGT GAC CCT CGG CGG CAA CAC CGT GGA GGC GAG 

mm 9 arg lys arg 9ly gly asp pro arg arg gln his arg & 9 lu 

GGC GOT CGA GTA CAG CCT CGG CAC ACC GCC GGA CGG GGT GAC GGG CCC GCT GGT GGC TGC 

m/iJi ar9 9 pro arg his thr ala HI/HI gly asp gly p" ala siy giy S. 

CCC CGC CGA CGA CAG TCC GGG CTG CAG TCC GTC GGA CTA CGA CAG GCT GCC GGT GTC CGG 

361/121 " 9 gly Val Sly i6U aCg gln ala ala Sly val arg 

TGC GGT GGT GCT GGT AGA TC 
cys gly gly ala gly arg 

SEQ ID N° 19A 
FIGURE 19A 



32/11 

TTG CGC AAC GGG GTG AGC ACC GAC GCG ATG ATG GCG CAA CTA TCG AAA CTG CAG G*C ATC 
le^arg asn .gly val ser thr asp ala met met^ala gln leu ser lys leu gVn asp Ue 

GCC AAC GCC AAC GAC GGC ACT CGC GCG GTG GGC ACC CCT GGC TAT CAG GCC AGC GTC GAC 

9ly arg ala Val gly thr P" « ly Cvr 9 ln »!• »« val asp 
122/41 152/51 y 

TAT GTG GTA AAC ACA CTG CGC AAC AGC GGT TTT GAT GTG CAA ACC CCG GAG TTC TCC GCT 

?f£/E aSn arg Ser gly Phe asp Val 91" thr pro glu phe ser ala 

J.BZ/&1 212/71 

CGC GTG TTC AAG GCC GAA AAA GGG GTG GTG ACC CTC GGC GGC AAC ACC GTG GAG GCG AGG 
242/81 P ^ glU lyS 9ly Val g^J;" gly gly asn th * ^ 9ln ala arg 

GCG CTC GAG TAC AGC CTC GGC ACA CCG CCG GAC GGG GTG ACG GGC CCG CTG GTG GCT GCC 
3u2 a /m 9 ?iy Pr ° Pr ° 3S,gl Val thr gly P" *™ -1 2 aS 

CCC GCC GAC GAC AGT CCG GGC TGC AGT CCG TCG GAC TAC GAC AGG CTG CCG GTG TCC GGT 
362/12! asp asp ser pro gly cys ser pro ser asp tyr asp arg leu pro val ser gly 

GCG GTG GTG CTG GTA GAT C 
ala val val leu val asp 



SEQ ID N° 19B 
FIGURE 19B 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 




T/FR98/01813 



68/185 



TGC GCA 


ACG 


GGG 


TGA 


GCA 


CCG 


cys ala 


thr 




OPA 


ala 


pro 


63/21 












CCA ACG 


CCA 


ACG 


ACG 


GCA 


CTC 


pro thr 


pro 


thr 


thr 


ala 


leu 


123/41 












ATG TGG 


TAA 


ACA 


CAC 


TGC 


GCA 


met trp 


OCH 


thr 


his 


cys 


ala 


183/61 










GCG TGT 


TCA 


AGG 


CCG 


AAA AAG 


ala cys 


ser 


arg 


pro 


lys lys 


243/81 












CGC TCG 


AGT 


ACA 


GCC 


TCG 


GCA 


arg ser 


ser 


thr 


ala 


ser 


ala 


303/101 












CCG CCG 


ACG 


ACA 


GTC 


CGG 


GCT 


pro pro 


thr 


thr 


val 


arg 


ala 


363/121 












CGG TGG 


TGC 


TGG 


TAG 


ATC 




arg trp 


cys 


trp 


AMB 


ile 















ACG 


CGA TGA 


TGG CGC 


AAC 


thr 


arg 


OPA 


trp arg 
93/31 


asn 


GCG 


CGG 


TGG 


GCA CCC 


CTG 


ala 


arg trp 


ala pro 


leu 








153/51 




ACA 


GCG 


GTT 


TTG ATG 


TGC 


thr 


ala 


val 


leu met 


cys 








213/71 


GGG 


TGG 


TGA 


CCC TCG 


GCG 


gly 


trp OPA 


pro ser 


ala 








273/91 




CAC 


CGC 


CGG 


ACG GGG 


TGA 


his 


arg 


arg 


thr gly OPA 








333/111 




GCA 


GTC 


CGT 


CGG ACT 


ACG 


ala 


val 


arg 


arg thr 


thr 



SEQ ID N° 19C 
FIGURE 19C 



TAT CGA AAC TGC AGG ACA TCG 
tyr arg asn cys arg thr ser 

GCT ATC AGG CCA GCG TCG ACT 
ala ile arg pro ala ser thr 

AAA CCC CGG AGT TCT CCG CTC 
lys pro arg ser ser pro leu 

GCA ACA CCG TGG AGG CGA GGG 
ala thr pro trp arg arg gly 

CGG GCC CGC TGG TGG CTG CCC 
arg ala arg trp trp leu pro 

ACA GGC TGC CGG TGT CCG GTG 
thr gly cys arg cys pro val 



Pgrtie d e la sequence nucleotidique de seq!9A 
1/1 31/11 

CTA TCG AAA CTG CAG GAC ATC GCC AAC GCC AAC GAC GGC ACT CGC GCG GTG GGC ACC CCT 
leu ser lys leu gin asp ile ala asn ala asn asp gly thr arg ala val gly thr pro 
61/21 gi/ 31 

GGC TAT CAG GCC AGC GTC GAC TAT GTG GTA AAC ACA CTG CGC AAC AGC GGT TTT GAT GTG 
gly tyr gin ala ser val asp tyr val val asn thr leu arg asn ser gly phe asp val 
121/41 151/51 

CAA ACC CCG GAG TTC TCC GCT CGC GTG TTC AAG GCC GAA AAA GGG GTG GTG ACC CTC GGC 
gin thr pro glu phe ser ala arg val phe lys ala glu lys gly val val thr leu alv 
181/61 211/71 

GGC AAC ACC GTG GAG GCG AGG GCG CTC GAG TAC AGC CTC GGC ACA CCG CCG GAC GGG GTG 
gly asn thr val glu ala arg ala leu glu tyr ser leu gly thr pro oro asp gly val 
241/81 271/91 

ACG GGC CCG CTG GTG GCT GCC CCC GCC GAC GAC AGT CCG GGC TGC AGT CCG TCG GAC TAC 
thr gly pro leu val ala ala pro ala asp asp ser pro gly cvs ser oro ser aso tyr 
301/101 331/111 " 

GAC AGG CTG CCG GTG TCC GGT GCG GTG GTG CTG GTA GAT C 
asp arg leu pro val ser gly ala val val leu val asp 



SEQ ID N° 19A 1 
FIGURE 19A 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



TCT/FR98/01813 



69/185 



1/1 31/11 

TAT CGA AAC TGC AGG ACA TCG CCA ACG CCA ACG ACG GCA CTC GCG CGG TGG GCA CCC CTG 
tyr arg asn cys arg thr ser pro thr pro thr thr ala leu ala arg trp ala pro leu 
61/21 g: / 31 

GCT ATC AGG CCA GCG TCG ACT ATG TGG TAA ACA CAC TGC GCA ACA GCG GTT TTG ATG TGC 

nif 3rg Pr ° ala SSr thr met trp 0CH thr his aXa tht val leu met cys 
121/41 151/51 

AAA CCC CGG AGT TCT CCG CTC GCG TGT TCA AGG CCG AAA AAG GGG TGG TGA CCC TCG GCG 

}??£f° Ser SSr Pr ° leU ala Cys Ser arg pro l * s tr P 0?A pro ser ala 

181/61 211/71 

GCA ACA CCG TGG AGG CGA GGG CGC TCG AGT ACA GCC TCG GCA CAC CGC CGG ACG GGG TGA 
ala thr pro trp arg arg gly arg ser ser thr ala ser ala his arg arg thr gly OPA 
241/81 271/91 

CGG GCC CGC TGG TGG CTG CCC CCG CCG ACG ACA GTC CGG GCT GCA GTC CGT CGG ACT ACG 

^n?/ti a trP trP lGU Pr ° Pr ° Pr ° thr thr val ar 9 aia a ^ val arg arg thr thr 
301/101 331/111 

ACA GGC TGC CGG TGT CCG GTG CGG TGG TGC TGG TAG ATC 

thr gly cys arg cys pro val arg trp cys trp AMB ile 

SEQ ID N° 19B' 
FIGURE 19B f 



1/1 

ATC GAA ACT GCA GGA CAT CGC 
ile glu thr ala gly his arg 
61/21 

CTA TCA GGC CAG CGT CGA CTA 
leu ser gly gin arg arg leu 
121/41 

AAC CCC GGA GTT CTC CGC TCG 
asn pro gly val leu arg ser 
181/61 

CAA CAC CGT GGA GGC GAG GGC 
gin his arg gly gly glu gly 
241/81 

GGG CCC GCT GGT GGC TGC CCC 
gly pro ala gly gly cys pro 
301/101 

CAG GCT GCC GGT GTC CGG TGC 
gin ala ala gly val arg cys 









31/11 




CAA 


CGC 


CAA 


CGA CGG 


CAC 


gin arg 


gin 


arg arg 


his 








91/31 




TGT 


GGT 


AAA 


CAC ACT 


GCG 


cys 


gly 


iys 


his thr 


ala 








151/51 




CGT 


GTT 


CAA 


GGC CGA AAA 


arg 


val 


gin 


gly arg lys 








211/71 




GCT 


CGA 


GTA 


CAG CCT 


CGG 


ala 


arg 


val 


gin pro 


arg 








271/91 


CGC 


CGA 


CGA 


CAG TCC 


GGG 


arg 


arg 


arg 


gin ser 


gly 








331/111 




GGT 


GGT 


GCT 


GGT AGA 


TC 


gly gly 


ala 


gly arg 






SEQ 


ID 


N° 19C 


? 



FIGURE 19C 



TCG 


CGC 


GGT 


GGG 


CAC CCC 


TGG 


ser 


arg gly 


gly his pro 


trp 


CAA 


CAG 


CGG 


TTT 


TGA TGT 


GCA 


gin 


gin 


arg 


phe 


OPA cys 


ala 


AGG 


GGT 


GGT 


GAC 


CCT CGG 


CGG 


arg gly gly 


asp 


pro arg 


arg 


CAC 


ACC 


GCC 


GGA CGG GGT 


GAC 


his 


thr 


ala 


gly 


arg gly 


asp 


CTG 


CAG 


TCC 


GTC 


GGA CTA 


CGA 


leu gin 


ser 


val 


gly leu 


arg 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 




•CT/FR98/01813 



70/185 



sequence Rv0418 predite par Cole et al. (Nature 393:537-544) et contenant 
seql9A' 



1/1 


















31/11 


















atg gtg 
Met val 
61/21 


aac 
asn 


aaa 

lys 


tec 
ser 


agg 
arg 


atg 
met 


atg 
met 


ccg 
pro 


gcg 
ala 


gtg ctg 
val leu 
91/31 


gcc 
ala 


gtg 
val 


get 
ala 


gtg 
val 


gtc 
val 


gtc 
val 


gca 
ala 


ttc 
phe 


ctg acg 
leu thr 
121/41 


acg 
thr 


ggc tgt 
gly cys 


ate 
ile 


egg 
arg 


tgg 
trp 


tct 
ser 


acg 
thr 


cag teg 
gin ser 
151/51 


egg 
arg 


ccc 
pro 


gtt 
val 


gtt 
val 


aac 
asn 


ggc 
gly 


ccc 
pro 


get 
ala 


gcc gca 
ala ala 
181/61 


gag 
glu 


ttc 
phe 


gcc 
ala 


gtt 
val 


gcg 
ala 


ttg 
leu 


cgc 
arg 


aac 
asn 


egg gtg 
arg val 
211/71 


age 
ser 


acc 
thr 


gac 
asp 


gcg 
ala 


atg 
met 


atg 
met 


gcg 
ala 


cac 
his 


eta teg 
leu ser 
241/81 


aaa 
lys 


ctg 
leu 


cag 
gin 


gac 
asp 


ate 
ile 


gcc 
ala 


aac 
asn 


gcc 
ala 


aac gac 
asn asp 
271/91 


ggc 
gly 


act 
thr 


cgc 
arg 


gcg 
ala 


gtg 
val 


ggc 
gly 


acc 
thr 


cct 
pro 


ggc tat 
gly tyr 
301/101 


cag 
gin 


gcc 
ala 


age 
ser 


gtc 
val 


gac 
asp 


tat 
tyr 


gtg 
val 


gta 
val 


aac aca 
asn thr 
331/111 


ctg 
leu 


cgc 
arg 


aac 
asn 


age 
ser 


ggt 
gly 


ttt 
phe 


gat 
asp 


gtg 
val 


caa acc 
gin thr 
361/121 


ccg 
pro 


gag ttc 
glu phe 


tec 
ser 


get 
ala 


cgc 
arg 


gtg 
val 


ttc 
phe 


aag gcc 
lys ala 
391/131 


gaa 
glu 


aaa 
lys 


ggg 

gly 


gtg 
val 


gtg 
val 


acc 
thr 


etc 
leu 


ggc 

gly 


ggc aac 
gly asn 
421/141 


acc 
thr 


gtg gag 
val glu 


gcg 
ala 


agg 
arg 


gcg 
ala 


etc 
leu 


gag 
glu 


tac age 
tyr ser 
451/151 


etc 
leu 


ggc 
gly 


aca 
thr 


ccg 
pro 


ccg 
pro 


gac 
asp 


ggg 

gly 


gtg 
val 


acg ggc 
thr gly 
481/161 


ccg 
pro 


ctg gtg 
leu val 


get 
ala 


gcc 
ala 


ccc 
pro 


gcc 
ala 


gac 
asp 


gac agt 
asp ser 
511/171 


ccg 
pro 


ggc 
gly 


tgc 
cys 


agt 
ser 


ccg 
pro 


teg 
ser 


gac 
asp 


tac 
tyr 


gac agg 
asp arg 
541/181 


ctg 
leu 


ccg 
pro 


gtg 
val 


tec 
ser 


ggt 
gly 


gcg 
ala 


gtg 
val 


gtg 
val 


ctg gta 
leu val 
571/191 


gat 
asp 


cgc 
arg 


ggc 
gly 


gtc 
val 


tgt 
cys 


cct 
pro 


ttt 
phe 


gcc 
ala 


cag aag 
gin lys 
601/201 


gaa 
glu 


gac 
asp 


gca 
ala 


gcc 
ala 


gcg 
ala 


cag 
gin 


cgc 
arg 


ggt 
gly 


gcg gtg 
ala val 
631/211 


gcg 
ala 


ctg 
leu 


ate 
ile 


att 
ile 


get 
ala 


gac 
asp 


aac 
asn 


ate 
ile 


gac gag 
asp glu 
661/221 


cag 
gin 


gcg 
ala 


atg 

met 


ggc 
gly 


ggc 
gly 


acc 
thr 


ctg 
leu 


ggg 

gly 


get aat 
ala asn 
691/231 


acc 
thr 


gac 
asp 


gtc 
val 


aag 
lys 


ate 
ile 


ccg 
pro 


gtg 
val 


gtg 
val 


agt gtc 
ser val 
721/241 


acc 
thr 


aag 

lys 


teg 
ser 


gtc 
val 


gga 
gly 


ttc 
phe 


cag 
gin 


eta 
leu 


cgc gga 
arg gly 
751/251 


cag 
gin 


tct 
ser 


ggg 

gly 


cca 
pro 


acc 
thr 


acc 
thr 


gtc 
val 


aag 
lys 


etc acg 
leu thr 
781/261 


gcg 
ala 


age 
ser 


acc 
thr 


caa 
gin 


agt 
ser 


ttc 
phe 


aag 
lys 


gcc 
ala 


cgc aac 
arg asn 
811/271 


gtc 
val 


ate 
ile 


gcg 
ala 


cag 
gin 


acg 
thr 


aag 
lys 


acg 
thr 


ggg 

gly 


teg teg 
ser ser 
841/281 


gcc 
ala 


aac 
asn 


gtg 
val 


gtg 
val 


atg 
met 


gca 
ala 


ggt 
gly 


gcg 
ala 


cat ttg 
his leu 
871/291 


gac 
asp 


age 
ser 


gtt 
val 


ccg 
pro 


gaa 
glu 


gga 
gly 


ccc 
pro 


ggc 
gly 


ate aac 
ile asn 
901/301 


gac 
asp 


aac 
asn 


ggc 
gly 


teg 
ser 


gga 
gly 


gtg 
val 


get 
ala 


gcg 
ala 


gtt ctg 
val leu 
931/311 


gaa 
glu 


acg 
thr 


gca 
ala 


gtg 
val 


cag 
gin 


ctg 
leu 


ggg 

gly 


aac 
asn 


tea ccg 
ser pro 
961/321 


cat 
his 


gtg 
val 


tec 
ser 


aac 
asn 


gcg 
ala 


gta 
val 


egg 
arg 


ttc 
phe 


gcc ttc 
ala phe 
991/331 


tgg 
trp 


ggc 
gly 


gcc 
ala 


gag 
glu 


gaa 
glu 


ttc 
phe 


ggc 

gly 


ctg 
leu 


att ggg 
ile gly 


tea 
ser 


cga 
arg 


aac 
asn 


tac 
tyr 


gtc 
val 


gag 
glu 


teg 
ser 


ctg 
leu 


gac ate 
asp ile 


gac 
asp 


gcg 
ala 


etc 
leu 


aaa 

lys 


ggc 
gly 


ate 
ile 


gcg 
ala 


ctg 
leu 



SEQ ID N° 19 D 
FIGURE 19D 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 




'CT/FR98/01813 



71/185 



1021/341 






tat ctg aac 


ttc 


gac 


tyr leu asn 


phe 


asp 


1081/361 




cag teg ctg 


ccg 


eta 


gin ser leu 


pro 


leu 


1141/381 






gag cgc acg 


ttc 


gtc 


glu arg thr 


phe val 


1201/401 






gac ggt egg 


tec 


gac 


asp gly arg 


ser 


asp 


1261/421 




tec ggc get 


gag gtc 


ser gly ala 


glu val 


1321/441 






gag cct ttc 


gat 


ccc 


glu pro phe 


asp 


pro 


1381/461 






gcg etc ggt 


ate 


aac 


ala leu gly 


ile 


asn 


1441/481 






ggc ggc ccc 


aac 


ggg 


gly gly pro 


asn gly 


.1501/501 






tga 






O.PA 







atg ttg gcg teg ccg 
met leu ala ser pro 

gac gec cgc ggt cag 
asp ala arg gly gin 

gec tat ctg aag atg 
ala tyr leu lys met 

tac gac ggc ttc acg 
tyr asp gly phe thr 

aag aag tec gee gag 
lys lys ser ala glu 

aac tat cac cag aag 
asn tyr his gin lys 

ggc get ggc gtc gcg 
gly ala gly val ala 

gtt ccg gtc atg gcg 
val pro val met ala 



1051/351 

aac ccg ggt tac ttc 
asn pro gly tyr phe 
1111/371 

ccg gtg gtg ccc gaa 
pro val val pro glu 
1171/391 

gec ggc aag ace gcg 
ala gly lys thr ala 
1231/411 

ctg gcg ggt ate cct 
leu ala gly ile pro 
1291/431 

caa gec gag etc tgg 
gin ala glu leu trp 
1351/451 

aca gac acc ctg gac 
thr asp thr leu asp 
1411/471 

tac gcg gtg ggt ttg 
tyr ala val gly leu 
1471/491 

gac cgc acc cgc cac 
asp arg thr arg his 



acc tac gac ggt gac 
thr tyr asp gly asp 

ggc teg gec ggt ate 
gly ser ala gly ile 

cag gac acc teg ttc 
gin asp thr ser phe 

teg ggt ggc ctg ttc 
ser gly gly leu phe 

ggc ggc acc gec gac 
gly gly thr ala asp 

cat ate gac cgc acc 
his ile asp arg thr 

tat gcg cag gac etc 
tyr ala gin asp leu 

ctg att gec aaa ccg 
leu ile ala lys pro 



SEQ ID N° 19D (suite) 
FIGURE 19D (suite) 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 




PCT/FR98/01813 



72/185 



ORF d'apres 


Cole et 


al. 


(Nature 


J?J • 30 / 


1/1 
















tag gcc 
AMB ala 
61/21 


att 
ile 


caa 
gin 


cgc 
arg 


tct 
ser 


gtt 
val 


cgt 
arg 


f* t rr at- 1- 
Luy alt 

leu ile 


cag gcg 
gin ala 
121/41 


egg 
arg 


tct 
ser 


aat 
asn 


ctg 
leu 


ggc 
gly 


gcg 
ala 


atg gtg 
met val 


gcc gtg 
ala val 
181/61 


get 
ala 


gtg 
val 


gtc 
val 


gtc 
val 


gca 
ala 


ttc 
phe 


ctg acg 
leu thr 


egg ccc 
arg pro 
241/81 


gtt 
val 


gtt 
val 


aac 
asn 


acre 

gly 


ccc 
pro 


get 
ala 


/~i f** f\ 
ycc gca 

ala ala 


age acc 
ser thr 
301/101 


gac 
asp 


gcg 
ala 


atg 
met 


atg 
met 


gcg 
ala 


cac 
his 


eta teg 
leu ser 


ggc act 
gly thr 
361/121 


cgc 
arg 


gcg 
ala 


gtg 
val 


arte 

yy <- 
gly 


acc 
thr 


cct 
pro 


ggc tar 
gly tyr 


ctg cgc 
leu arg 
421/141 


aac 
asn 


age 
ser 


ggt 
gly 


ttt 
phe 


gat 
asp 


gtg 
val 


caa acc 
gin thr 


gaa aaa 
glu lys 
481/161 


ggg 

gly 


gtg 
val 


gtg 
val 


acc 
thr 


etc 
leu 


ggc 
gly 


fffTf* aa^ 

gly asn 


etc ggc 
leu gly 
541/181 


aca 
thr 


ccg 
pro 


ccg 
pro 


gac 
asp 


ggg 
gly 


gtg 
val 


y y y *— 
thr gly 


ccg ggc 
pro gly 
601/201 


tgc 
cys 


agt 
ser 


ccg 
pro 


teg 
ser 


gac 
asp 


tac 
tyr 


gac agg 
asp arg 


gat cgc 
asp arg 
661/221 


ggc 
gly 


gtc 

val 


tgt 
cys 


cct 
pro 


ttt 
phe 


gcc 
ala 


way day 

gin lys 


gcg ctg 
ala leu 
721/241 


ate 
l ±e 


att 
lie 


get 
aia 


gac 
asp 


aac 
asn 


ate 
lie 


ft a c era <■» 
yaw y «y 

asp glu 


acc gac 
thr asp 
781/261 


gtc 
val 


aag 
lys 


ate 
ile 


ccg 
pro 


gtg 
val 


gtg 

val 


agt gtc 
ser val 


cag tct 
gin ser 
841/281 


ggg 

gly 


cca 
pro 


acc 
thr 


acc 
thr 


gtc 
val 


aag 
lys 


etc acg 
leu thr 


gtc ate 
val ile 
901/301 


gcg 
ala 


cag 
gin 


acg 
thr 


aag 
lys 


acg 
thr 


ggg 

gly 


teg teg 
ser ser 


gac age 
asp ser 
961/321 


gtt 
val 


ccg 
pro 


gaa 
glu 


gga 
gly 


ccc 
pro 


ggc 
gly 


ate aac 
ile asn 


gaa acg 
glu thr 


gca 
ala 


gtg 
val 


cag 
gin 


ctg 
leu 


ggg 

gly 


aac 
asn 


tea ccg 
ser pro 



■544) et contenant Rv0418 
31/11 

ggt egg tgg gat gcg aaa get gcg egg cga 

gly arg trp asp ala lys ala ala arg arg 
91/31 

aac aaa tec agg atg atg ccg gcg gtg ctg 

asn lys ser arg met met pro ala val leu 
151/51 

acg ggc tgt ate egg tgg tct acg cag teg 

thr gly cys ile arg trp ser thr gin ser 
211/71 

gag ttc gcc gtt gcg ttg cgc aac egg gtg 

glu phe ala val ala leu arg asn arg val 
271/91 

aaa ctg cag gac ate gcc aac gcc aac gac 

lys leu gin asp ile ala asn ala asn asp 
331/111 

cag gcc age gtc gac tat gtg gta aac aca 

gin ala ser val asp tyr val val asn thr 
391/131 

ccg gag ttc tec get cgc gtg ttc aag gcc 

pro glu phe ser ala arg val phe lys ala 
451/151 

acc gtg gag gcg agg gcg etc gag tac age 

thr val glu ala arg ala leu glu tyr ser 
511/171 

ccg ctg gtg get gcc ccc gcc gac gac agt 

pro leu val ala ala pro ala asp aso ser 
571/191 

ctg ccg gtg tec ggt gcg gtg gtg ctg gta 

leu pro val ser gly ala val val leu val 
631/211 

gaa gac gca gcc gcg cag cgc ggt gcg gtg 

glu asp ala ala ala gin arg gly ala val 
691/231 

cag gcg atg ggc ggc acc ctg ggg get aat 

gin ala met gly gly thr leu gly ala asn 
751/251 

acc aag teg gtc gga ttc cag eta cgc gga 

thr lys ser val gly phe gin leu arg gly 
811/271 

gcg age acc caa agt ttc aag gcc cgc aac 

ala ser thr gin ser phe lys aia arg asn 
871/291 

gcc aac gtg gtg atg gca ggt gcg cat ttg 

ala asn vai val met ala gly ala his leu 
931/311 

gac aac ggc teg gga gtg get gcg gtt ctg 

asp asn gly ser gly val ala ala val leu 
991/331 

cat gtg tec aac gcg gta egg ttc gcc ttc 

his val ser asn ala val arg phe ala phe 



SEQ ID N° 19 F 



FIGURE 19F 
FEU1LLE DE REMPLACEM ENT (REGLE 26) 



WO 99/09186 CT/FR98/018I3 

73/185 

1021/341 1051/351 

tgg ggc gcc gag gaa ttc ggc ctg att ggg tea cga aac tac gtc gag teg ctg gac ate 
trp gly ala glu glu phe gly leu ile gly ser arg asn tyr val glu ser leu asp ile 
1081/361 1111/371 

gac gcg etc aaa ggc ate gcg ctg tat ctg aac ttc gac atg ttg gcg teg ccg aac ccg 
asp ala leu lys gly ile ala leu tyr leu asn phe asp met leu ala ser pro asn pro 
1141/381 1171/391 

ggt tac ttc acc tac gac ggt gac cag teg ctg ccg eta gac gcc cgc ggt cag ccg gtg 
gly tyr phe thr tyr asp gly asp gin ser leu pro leu asp ala arg gly gin pro val 
1201/401 1231/411 

gtg ccc gaa ggc teg gcc ggt ate gag cgc acg ttc gtc gcc tat ctg aag atg gcc ggc 
val pro glu gly ser ala gly ile glu arg thr phe val ala tyr leu lys met ala gly 
1261/421 1291/431 

aag acc gcg cag gac acc teg ttc gac ggt egg tec gac tac gac ggc ttc acg ctg gcg 
lys thr ala gin asp thr ser phe asp gly arg ser asp tyr asp gly phe thr leu ala 
1321/441 1351/451 

ggt ate cct teg ggt ggc ctg ttc tec . ggc get gag gtc aag aag tec gcc gag caa gcc 
gly ile pro ser gly gly leu phe ser gly ala glu val lys lys ser ala glu gin ala 
1381/461 1411/471 

gag etc tgg ggc ggc acc gcc gac gag cct ttc gat ccc aac tat cac cag aag aca gac 
glu leu trp gly gly thr ala asp glu pro phe asp pro asn tyr his gin lys thr asp 
1441/481 1471/491 

acc ctg gac cat ate gac cgc acc gcg etc ggt ate aac ggc get ggc gtc gcg tac gcg 
thr leu asp his ile asp arg thr ala leu gly ile asn gly ala gly val ala tyr ala 
1501/501 1531/511 

gtg ggt ttg tat gcg cag gac etc ggc ggc ccc aac ggg gtt ccg gtc atg gcg gac cgc 
val gly leu tyr ala gin asp leu gly gly pro asn gly val pro val met ala asp arg 
1561/521 

acc cgc cac ctg att gcc aaa ccg tga 
thr arg his leu ile ala lys pro OPA 

SEQ ID N° 19F (suite) 
FIGURE 19F (suite) 



31/11 



CGA GAC 


AGT 


GGT GCG 


GGA 


CAC 


TTG 


AGT 


TCG 


GCT GCT 


AAC 


GAC 


GCC 


AGA 


GTC 


GCC 


CGC 


TTC 


arg asp 


ser 


gly ala 


gly 


his 


leu 


ser 


ser 


ala ala 


asn 


asp 


ala 


arg 


val 


ala 


arg 


phe 


61/21 
















91/31 












CGC GGT 


GTG 


GGA CTC 


ACG 


TTC 


GGT 


GAG 


GGT 


ACA GCG 


GAC 


CTT 


CGA 


GCA 


CGC 


AAT 


•ATC 


GTG 


arg gly 


val 


gly leu 


thr 


phe 


gly 


glu 


gly 


thr ala 


asp 


leu 


arg 


ala 


arg 


asn 


ile 


val 


121/41 
















151/51 














GGC CGG 


CTG 


GCA ACC 


GTC 


GGT 


TTC 


GAC 


GTT 


GGT GAC 


GAC 


CCC 


TCG 


TTC 


ATG 


AAT 


CGT 


TCT 


gly arg 


leu 


ala thr 


val 


gly 


phe 


asp 


val 


gly asp 


asp 


pro 


ser 


phe 


met 


asn 


arg 


ser 


181/61 
















211/71 












TGA GCT 


CCC 


CGT TTT 


GCT 


GGA 


TGC 


CCA 


GGC 


ACC GCC 


GGT 


ACT 


GCT 


GCG 


CTT 


AAG 


CTT 


GTC 


OPA ala 


pro 


arg phe 


ala 


gly 


cys 


pro 


gly 


thr ala gly 


thr 


ala 


ala 


leu 


lys 


leu 


val 


241/81 
















271/91 
















GCA CAT 


GGT 


GCC GGC 


AGG 


GAG 


GAA 


CAG 


TGG 


GCA AGC 


AGC 


TAG 


CCG 


CGC 


TCG 


CCG 


CGC 


TGG 


ala his 


gly 


ala gly 


arg 


glu 


glu 


gin 


trp 


ala ser 


ser 


AMB 


pro 


arg 


ser 


pro 


arg 


trp 


301/101 
















331/111 











TCG GTG CGT GCA TGC TCG CAG CCG GAT GCA CCA ACG TGG TCG ACG GGA CCG CCG TGG CTG 
ser val arg ala cys ser gin pro asp ala pro thr tro ser thr gly pro pro trp leu 
361/121 

CCG ACA AAT CCG GAC CAC TGC ATC AGG ATC 
pro thr asn pro asp his cys ile arg ile 

SEQ ID N° 20A 
FEUILLE DE REM ^^E^REGLE 26) 



WO 99/09186 




PCT/FR98/01813 



74/185 

















J<£ / ± J. 












GAG ACA 










ACT TGA GTT 


CGG 


CTG CTA ACG 


ACG CCA GAG 


TCG 


CCC 


GCT 


TCC 


glu thr 


val 


val 


my 


asp 


thr OPA val 


arg 


xeu leu tnr 


thr pro glu 


ser 


pro 


ala 


ser 


62/21 














92/31 








GCG GTG 


TGG 


GAC 


TCA 


CGT 


TCG GTG AGG 


GTA 


CAG CGG ACC 


TTC GAG CAC 


GCA 


ATA 


TCG 


TGG 


ala Vdl 


trp 


asp 


ser 


arg 


ser val arg 


val 


gin arg thr 


phe glu his 


ala 


ile 


ser 


trp 


122/41 






















GCC GGC 


TGG 


CAA 


CCG 


TCG 


GTT TCG ACG 


TTG 


GTG ACG ACC 


CCT CGT TCA 


TGA 


ATC 


GTT 


CTT 


ala gly 


trp 


gin 


pro 


ser 


val ser thr 


leu 


val thr thr 


pro arg ser 


OPA 


ile 


val 


leu 


182/61 














212/71 










GAG CTC 


CCC 


GTT 


TTG 


CTG 


GAT GCC CAG 


GCA 


CCG CCG GTA 


CTG CTG CGC 


TTA 


AGC 


TTG 


TCG 


glu leu 


pro 


val 


leu 


leu 


asp ala gin ala 


pro pro val 


leu leu arg 


leu 


ser 


leu 


ser 


242/81 














272/91 








CAC ATG 


GTG 


CCG 


GCA 


GGG 


AGG AAC AGT 


GGG 


CAA GCA GCT 


AGC CGC GCT 


CGC 


CGC 


GCT 


GGT 


his met 


val 


pro 


ala 


gly 


arg asn ser 


gly 


gin ala ala 


ser arg ala 


arg 


arg 


ala 


gly 


302/101 














332/111 




CGG TGC 


GTG 


CAT 


GCT 


CGC 


AGC CGG ATG 


CAC 


CAA CGT GGT 


CGA CGG GAC 


CGC 


CGT 


GGC 


TGC 


arg cys 
362/121 


val 


his 


ala 


arg 


ser arg met 


his 


gin arg gly 


arg arg asp 


arg 


arg 


gly 


cys 


CGA CAA 


ATC 


CGG 


ACC 


ACT 


GCA TCA GGA TC 














arg gin 


ile 


arg 


thr 


thr 


ala ser gly 

















SEQ ID N° 20B 
FIGURE 20B 

















33/11 


















AGA CAG 


TGG 


TGC 


GGG 


ACA 


CTT GAG TTC 


GGC 


TGC TAA 


CGA 


CGC 


CAG AGT 


CGC 


CCG 


CTT 


CCG 


arg gin 


trp 


cys 


gly 


thr 


leu glu phe 


gly 


cys OCH 


arg 


arg gin 


ser 


arg 


pro 


leu 


pro 


63/21 














93/31 












CGG TGT 


GGG 


ACT 


CAC 


GTT 


CGG TGA GGG 


TAG 


AGC GGA 


CCT 


TCG AGC ACG 


CAA 


TAT 


CGT 


GGG 


arg cys 
123/41 


gly 


thr 


his 


val 


arg OPA gly 


tyr 


ser gly 
153/51 


pro 


ser 


ser 


thr 


gin 


tyr 


arg 


gly 


CCG GCT 


GGC 


AAC 


CGT 


CGG 


TTT CGA CGT 


TGG 


TGA CGA 


CCC 


CTC 


GTT 


CAT 


GAA 


TCG 


TTC 


TTG 


pro ala 


gly 


asn 


arg 


arg 


phe arg arg 


trp 


OPA arg 


pro 


leu 


val 


his 


glu 


ser 


phe 


leu 


183/61 














213/71 










AGC TCC 


CCG 


TTT 


TGC 


TGG 


ATG CCC AGG 


CAC 


CGC CGG 


TAC 


TGC 


TGC 


GCT 


TAA 


GCT 


TGT 


CGC 


ser ser 


pro 


phe 


cys 


trp 


met pro arg 


his 


arg arg 


tyr 


cys 


cys 


ala 


OCH 


ala 


cys 


arg 


243/81 














273/91 












ACA TGG 


TGC 


CGG 


CAG 


GGA 


GGA ACA GTG 


GGC 


AAG CAG 


CTA 


GCC 


GCG 


CTC 


GCC 


GCG 


CTG 


GTC 


thr trp 


cys 


arg 


gin 


gly 


gly thr val 


gly 


lys gin 


leu 


ala 


ala 


leu 


ala 


ala 


leu 


val 


303/101 














333/111 














GGT GCG 


TGC 


ATG 


CTC 


GCA 


GCC GGA TGC 


ACC 


AAC GTG 


GTC 


GAC 


GGG 


ACC 


GCC 


GTG 


GCT 


GCC 


gly ala 


cys 


met 


leu 


ala 


ala gly cys 


thr 


asn val 


val 


asp gly thr 


ala 


val 


ala 


ala 


363/121 




























GAC AAA 


TCC 


GGA 


CCA 


CTG 


CAT CAG GAT 


C 




















asp lys 


ser 


gly 


pro 


leu 


his gin asp 























SEQ ID N° 20C 
FEUILLE DE RENlP££gS6!E?ftlREGLE 26) 



WO 99/09186 ^ftcT/FR98/018l3 

75/185 

partie de la sequence nucleotidique de seq20A 
1/1 

TGT GGG ACT CAC GTT CGG TGA GGG TP 
cys gly thr his val arg OPA gly t} 
61/21 

GCT GGC AAC CGT CGG TTT CGA CGT TC 
ala gly asn arg arg phe arg arg tr 
121/41 

TCC CCG TTT TGC TGG ATG CCC AGG CP 
ser pro phe cys trp met pro arg hi 
181/61 

TGG TGC CGG CAG GGA GGA ACA GTG GG 
trp cys arg gin gly gly thr val gl 
241/81 

GCG TGC ATG CTC GCA GCC GGA TGC AC 
ala cys met leu ala ala gly cys th 
301/101 

AAA TCC GGA CCA CTG CAT CAG GAT C 
lys ser gly pro leu his gin asp 





31/11 


















AGC 


GGA CCT 


TCG 


AGC 


ACG 


CAA 


TAT 


CGT 


GGG 


CCG 


ser 


gly pro 


ser 


ser 


thr gin 


tyr 


arg 


gly 


pro 




91/31 
















TGA 


CGA CCC 


CTC 


GTT 


CAT 


GAA 


TCG 


TTC 


TTG 


AGC 


OPA 


arg pro 


leu 


val 


his 


glu 


ser 


phe 


leu 


ser 




151/51 
















CGC 


CGG TAC 


TGC 


TGC 


GCT 


TAA 


GCT 


TGT 


CGC 


ACA 


arg 


arg tyr 


cys 


cys 


ala 


OCH 


ala 


cys 


arg 


thr 




211/71 














AAG 


CAG CTA 


GCC 


GCG 


CTC 


GCC 


GCG 


CTG 


GTC 


GGT 


lys 


gin leu ala 


ala 


leu 


ala 


ala 


leu 


val 


gly 




271/91 
















AAC 


GTG GTC 


GAC 


GGG 


ACC 


GCC 


GXG 


GCT 


GCC 


GAC 


asn 


val val 


asp 


gly thr ala 


val 


ala 


ala 


asp 



SEQ ID N° 2 OA' 
FIGURE 20A' 



31/11 

GTG GGA CTC ACG TTC GGT GAG GGT ACA GCG GAC CTT CGA GCA CGC AAT ATC GTG GGC CGG 
val gly leu thr phe gly glu gly thr ala asp leu arg ala arg asn ile val gly arg 
61/21 91/31 

CTG GCA ACC -GTC GGT TTC GAC GTT GGT GAC GAC CCC TCG TTC ATG AAT CGT TCT TGA GCT 
leu ala thr val gly phe asp val gly asp asp pro ser phe met asn arg ser CPA ala 
121/41 151/51 

CCC CGT TTT GCT GGA TGC CCA GGC ACC GCC GGT ACT GCT GCG CTT AAG CTT GTC GCA CAT 
pro arg phe ala gly cys pro gly thr ala gly thr ala ala leu lys leu val ala his 
181/61 211/71 

GGT GCC GGC AGG GAG GAA CAG TGG GCA AGC AGC TAG CCG CGC TCG CCG CGC TGG TCG GTG 
gly ala gly arg glu glu gin trp ala ser ser AMB pro arg ser pro arg trp ser val 
241/81 271/91 

CGT GCA TGC TCG CAG CCG GAT GCA CCA ACG TGG TCG ACG GGA CCG CCG TGG CTG CCG ACA 

301/101 ^ Pr ° Pr ° trp leU Pr ° thr 

AAT CCG GAC CAC TGC ATC AGG ATC 
asn pro asp his cys ile arg ile 



SEQ ID N° 20B' 
FIGURE 20B' 



FEUILLE DE REMPLACEMENT (REGLE 26) 




WO 99/09186 ^^PCT/FR98/01813 



76/185 



1/1 31/11 

GTG TGG GAC TCA CGT TCG GTG AGG GTA CAG CGG ACC TTC GAG CAC GCA ATA TCG TGG GCC 
val trp asp ser arg ser val arg val gin arg thr phe glu his ala ile ser crp ala 
61/21 91/31 

GGC TGG CAA CCG TCG GTT TCG ACG TTG GTG ACG ACC CCT CGT TCA TGA ATC GTT CTT GAG 
gly trp gin pro ser val ser thr leu val thr thr pro arg ser OPA ile val leu glu 
121/41 151/51 

CTC CCC GTT TTG CTG GAT GCC CAG GCA CCG CCG GTA CTG CTG CGC TTA AGC TTG TCG CAC 
leu pro val leu leu asp ala gin ala pro pro val leu leu arg leu ser leu ser his 
181/61 211/71 

ATG GTG CCG GCA GGG AGG AAC AGT GGG CAA GCA GCT AGC CGC GCT CGC CGC GCT GGT CGG 
met val pro ala gly arg asn ser gly gin ala ala ser arg ala arg arg ala gly arg 
241/81 271/91 

TGC GTG CAT GCT CGC AGC CGG ATG CAC CAA CGT GGT CGA CGG GAC CGC CGT GGC TGC CGA 
cys val his ala arg ser arg met his gin arg gly arg arg asp arg arg gly cys arg 
301/101 

CAA ATC CGG ACC ACT GCA TCA GGA TC 
gin ile arg thr thr ala ser gly 

SEQ ID N° 20C 1 



FIGURE 20C 



sequence Rv3576 pr^dite par Cole etal. (Nature 393:537-544) et contenant seq20A t 
1/1 31/11 

atg ggc aag cag eta gec gcg etc gee gcg ctg gtc ggt gcg tgc atg etc gca gee gga 
met gly lys gin leu ala ala leu ala ala leu val gly ala cys met leu ala ala gly 
61/21 91/31 

tgc acc aac gtg gtc gac ggg ace gec gtg get gec gac aaa tec gga cca ctg cat cag 
cys thr asn val val asp gly thr ala val aia ala asp lys ser gly pro leu his gin 
121/41 151/51 

gat ccg ata ccg gtt tea gcg ctt gaa ggg ctg ctt etc gac ttg age cag ate aat gec 
asp pro ile pro val ser ala leu glu gly leu leu leu asp leu ser gin ile asn ala 
181/61 211/71 

gcg ctg ggt gcg aca teg atg aag gtg tgg ttc aac gec aag gca atg tgg gac tgg age 
ala leu gly ala thr ser met lys val trp phe asn ala lys ala met trp asp trp ser 
241/81 271/91 

aag age gtg gee gac aag aat tgc ctg get ate gac ggt cca gca cag gaa aag gtc tat 
lys ser val ala asp lys asn cys leu ala ile asp gly pro ala gin glu lys val tyr 
301/101 331/111 

gee ggc acc ggg tgg acc get atg cgc ggc caa egg ctg gat gac age ate gat gac tec 
ala gly thr gly trp thr ala met arg gly gin arg leu a3p asp ser ile ast> asp ser 
361/121 391/131 

aag aaa cgc gac cac tac gec att caa gcg gtc gtc ggc ttc ccg acc gca cat gat gee 
lys lys arg asp his tyr ala ile gin ala val val gly phe pro thr ala his asp ala 
421/141 451/151 

gag gag ttc tac age tec teg gtg caa age tgg age age tgc teg aac cgc egg ttt gtc 
glu glu phe tyr ser ser ser val gin ser trp 3er 3er cys ser asn arg arg phe vai 
481/161 511/171 

gaa gtc acc ccc gga cag gac gac gee gee tgg act gtg get gac gtt gtc aac gac aac 
glu val thr pro gly gin asp asp ala ala trp thr val ala asp val val asn asp as- 
541/161 571/191 

ggc atg etc agt age teg cag gtt cag gaa ggc ggc gac gga tgg acc tgc cag cgt gee 
gly met leu ser ser ser gin val gin glu gly gly asp gly trp thr cys gin arg ala 
601/201 631/211 

ctg act gcg cgc aac aac gtc act ate gac att gtc acg tgc gee tat age caa ccg gat 
leu thr ala arg asn asn val thr ile asp ile val thr cys ala tyr ser gin oro asc 
661/221 691/231 

ttg gtg gcg att ggc ate get aac caa ate gcg gec aag gtt get aag cag tag 
leu val ala ile gly ile ala asn gin ile ala ala lys val ala lys gin AMB 

SEQ ID N° 20D 



FIGURE 20D 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 

77/185 



ORF d'apres Cole et al. (Nature 393:537- 
1/1 

taa get tgt cgc aca tgg tgc egg cag gga 
OCH ala cys arg thr trp cys arg gin gly 
61/21 

gcc gcg ctg gtc ggt gcg tgc atg etc gca 
ala ala leu val gly ala cys met leu ala 
121/41 

gcc gtg get gcc gac aaa tec gga cca ctg 
ala val ala ala asp lys ser gly pro leu 
181/61 

gaa ggg ctg ctt etc gac ttg age cag ate 
glu gly leu leu leu asp leu ser gin ile 
241/81 

gtg tgg ttc aac gcc aag gca atg tgg gac 
val trp phe asn ala lys ala met trp asp 
301/101 

ctg get ate gac ggt cca gca cag gaa aag 
leu ala ile asp gly pro ala gin glu lys 
361/121 

cgc ggc caa egg ctg gat gac age ate gat 
arg gly gin arg leu asp asp ser ile asp 
421/141 

caa gcg gtc gtc ggc ttc ccg ace gca cat 
gin ala val val gly phe pro thr ala his 
481/161 

caa age tgg age age tgc teg aac cgc egg 
gin ser trp ser ser cys ser asn arg arg 
541/181 

gcc gcc* tgg act gtg get gac gtt gtc aac 
ala ala trp thr val ala asp val val asn 
601/201 

cag gaa ggc ggc gac gga tgg ace tgc cag 
gin glu gly gly asp gly trp thr cys gin 
661/221 

ate gac att gtc acg tgc gcc tat age caa 
ile asp ile val thr cys ala tyr ser gin 
721/241 

caa ate gcg gcc aag gtt get aag cag tag 
gin ile ala ala lys val ala lys gin AMB 



544) et contenant Rv3576 



31/11 



gga aca 
gly thr 
91/31 


gtg ggc aag 
val gly lys 


cag eta 
gin leu 


que 

ala 


gcg 
ala 


etc 
leu 


ace aaa 
ala gly 
151/51 


tgc ace 
cys thr 


aac 
asn 


gtg 
val 


gtc 
val 


gac 
asp 


999, 
gly 


acc 
thr 


cat cag 
his gin 
211/71 


gat ccg 
asp pro 


ata 

ile 


ccg 
pro 


gtt 
val 


ser 


gcg 
ala 


CtX 

leu 


aat gcc 
asn ala 
271/91 


gcg ctg ggt 
ala leu gly 


gcg 
ala 


aca 
thr 


ccg 
ser 


acg 
met 


aag 
lys 


taa aac 
trp ser 
331/111 


aag age 
lys ser 


gtg 
val 


gcc 
ala 


gac 
asp 


aag 
lys 


aar 
asn 


tgc 
cys 


gtc tat 
val tyr 
391/131 


gcc ggc acc 
ala gly thr 


ggg tgg 
gly trp 


acc 
thr 


get 
ala 


atg 
met 


gac tec 
asp ser 
451/151 


aag aaa 
lys lys 


cgc 
arg 


gac 
asp 


cac 
his 


tac 
tyr 


gcc 
ala 


att 
ile 


gat gcc 
asp ala 
511/171 


gag gag ttc 
glu glu phe 


tac 
tyr 


age 
ser 


tec 
ser 


teg 
ser 


gtg 
val 


ttt gtc 
phe val 
571/191 


gaa gtc 
glu val 


acc 
thr 


ccc gga 
pro gly 


cag 
gin 


gac 
asp 


gac 
asp 


gac aac 
asp asn 
631/211 


ggc atg 
gly met 


etc 
leu 


agt 
ser 


age 
ser 


teg 
ser 


cag 
gin 


gtt 
val 


cgt gcc 
arg ala 
691/231 


ctg act 
leu thr 


gcg 
ala 


cgc 
arg 


aac 
asn 


aac 
asn 


gtc 
val 


act 
thr 


ccg gat 
pro asp 


ttg gtg 
leu val 


gcg 
ala 


att ggc 
ile gly 


ate 
ile 


get 
ala 


aac 
asn 



SEQ ID N° 20F 
FIGURE 20F 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 




1/1 



GTC CTG 


GTC 


GCC 


GCG 


CAA 


CTG 


val leu 


val 


ala 


ala 


gin leu 


61/21 












CGC TGG 


TAG 


TGG 


CGA 


TGG 


TGT 


arg trp 


AMB 


trp 


arg 


trp 


cys 


121/41 












GCG GCC 


TGC 


GGC 


TGG 


TCG 


CCG 


ala ala 


cys 


gly 


trp 


ser 


pro 


181/61 












CGG CGC 


TGG 


ACG 


TCG 


CCG 


TGC 


arg arg 


trp 


thr 


ser 


pro 


cys 


241/81 












AAA ACT 


TCA 


CCG 


CCC 


GCA AGT 


lys thr 


ser 


pro 


pro 


ala 


ser 


301/101 












CAG ACG 


TGC 


GGT 


CGG 


GAG 


TGA 


gin thr 


cys 


gly 


arg 


glu OPA 


361/121 












TGC TGG 


CCG 


ACA 


GCA 


TCG 


GCT 


cys trp 


pro 


thr 


ala 


ser 


ala 


TCC TGG 


TCG 


CCG 


CGC 


AAC 


TGG 


ser trp 


ser 


pro 


arg 


asn 


trp 


62/21 












GCT GGT 


AGT 


GGC 


GAT 


GGT 


GTT 


ala gly 


ser 


gly 


asp 


gly val 


122/41 












CGG CCT 


GCG 


GCT 


GGT 


CGC 


CGC 


arg pro 


ala 


ala 


gly 


arg 


arg 


182/61 












GGC GCT 


GGA 


CGT 


CGC 


CGT 


GCT 


gly ala 


gly 


arg 


arg 


arg 


ala 


242/81 












AAA CTT 


CAC 


CGC 


CCG 


CAA GTA 


lys leu 


his 


arg 


pro 


gin val 


302/101 












AGA CGT 


GCG 


GTC 


GGG 


AGT 


GAA 


arg arg 


ala 


val 


gly 


ser 


glu 


362/121 












GCT GGC 


CGA 


CAG 


CAT 


CGG 


CTT 


ala gly 


arg 


gin 


his 


arg 


leu 



78/185 









31/11 




GCC 


GGT 


CCC 


GAT GGA AAG 


ala 


gly pro 


asp gly lys 








91/31 




TAG 


CAG 


GAT 


TGC GGG 


TCG 


AMB 


gin asp 


cys gly 


ser 








151/51 




CGC 


GCG 


CCG 


AAA TGA 


TAC 


arg 


ala 


pro 


lys OPA tyr 








211/71 




TGG 


CCA 


GCT 


CGA CCG 


GAC 


trp 


pro 


ala 


arg pro 


asp 








271/91 




ACG 


AGC 


TGC 


AGA CGC 


GAC 


thr 


ser 


cys 


arg arg 


asp 








331/111 




ACA 


CGC 


TGC 


TCA ACG 


GCG 


thr 


arg 


cys 


ser thr 


ala 


TGC 


GGG 


ATC 






cys 


gly ile 







SEQ ID N° 21A 
FIGURE 21A 









32/11 




CCG 


GTC 


CCG 


ATG GAA 


AGT 


pro 


val 


pro 


met glu 


ser 








92/31 




AGC 


AGG 


ATT 


GCG GGT 


CGA 


ser 


arg 


ile 


ala gly 


arg 








152/51 




GCG 


CGC 


CGA 


AAT GAT 


ACC 


ala 


arg 


arg 


asn asp 


thr 








212/71 




GGC 


CAG 


CTC 


GAC CGG 


ACA 


gly 


gin 


leu 


asp arg 


thr 








272/91 




CGA 


GCT 


GCA 


GAC GCG 


ACT 


arg 


ala 


ala 


asp ala 


thr 








332/111 




CAC 


GCT 


GCT 


CAA CGG 


CGG 


his 


ala 


ala 


gin arg 


arg 


GCG 


GGA 


TC 






ala 


gly 









SEQ ID N° 2 IB 



FIGURE 21B 



^^>CT/FR98/01813 



TGT TCA 


CGA 


TCG 


CGC 


TTC TGC 


cys 


ser 


arg 


ser 


arg 


phe cys 


AGG 


CTG 


CGA 


TGG 


CCA 


GCA CCA 


arg 


leu 


arg 


trp 


pro 


ala pro 


CCG 


CGA 


TCA 


CGA 


AAT 


ACA TGT 


pro 


arg 


ser 


arg 


asn 


thr cys 


ACG 


ATG 


TGG 


AGG 


GGG 


CGC AGA 


thr met 


trp 


arg 


gly 


arg arg 


TGG 


CCG 


ACA 


CCG 


ACG 


TCA TCG 


trp pro 


thr 


pro 


thr 


ser ser 


GTC 


AGG 


CGC 


TGC 


TGG 


ATA AGA 


val 


arg 


arg 


cys 


trp 


ile arg 



GTT 


CAC 


GAT 


CGC 


GCT 


TCT 


GCC 


val 


his 


asp 


arg 


ala 


ser 


ala 


GGC 


TGC 


GAT 


GGC 


CAG 


CAC 


CAG 


gly cys 


asp 


gly 


gin 


his gin 


CGC 


GAT 


CAC 


GAA 


ATA 


CAT 


GTC 


arg 


asp 


his 


glu 


ile 


his 


val 


CGA 


TGT 


GGA 


GGG 


GGC 


GCA 


GAA 


arg 


cys 


gly 


gly 


gly 


ala glu 


GGC 


CGA 


CAC 


CGA 


CGT 


CAT 


CGC 


gly arg 


his 


arg 


arg 


his 


arg 


TCA 


GGC 


GCT 


GCT 


GGA 


TAA 


GAT 


ser 


gly 


ala 


ala 


gly 


OCH 


asp 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 




VFR98/01813 



79/185 



33/11 



CCT GGT 


CGC 


CGC 


GCA 


ACT 


GGC CGG TCC CGA 


TGG AAA GTG 


TTC 


ACG 


ATC 


GCG CTT CTG 

www vl i w X w 


wwV9 


pro gly 


arg 


arg 


ala 


thr 


gly arg ser arg 


trp lys val 


phe thr ile 


ala leu leu 


pro 


63/21 












93/31 










CTG GTA 


GTG 


GCG 


ATG 


GTG 


TTA GCA GGA TTG 


CGG GTC GAG 

www w ** w u^iv 


GCT 


GCG 


ATG 


GCC AGC Aff 

www /VJw /\ww 


AWw 


leu val 


val 


ala met 


val 


leu ala gly leu 


arn val nlu 


ala 


ala 


met 


d-Lcx ocjl Lnr 


ser 


123/41 












153/51 












GGC CTG 


CGG 


CTG 


GTC 


GCC 


GCG CGC GCC GAA 


ATG ATA CCC 


GCG 


ATC 


ACG 


AAA TAC ATG 


TCG 


gly leu 


arg 


leu 


val 


ala 


ala arg ala glu 


met ile pro 


ala 


ile 


thr 


lys tyr met 


ser 


183/61 












213/71 










GCG CTG 


GAC 


GTC 


GCC 


GTG 


CTG GCC AGC TCG 


ACC GGA CAC 


GAT 


GTG 


GAG 


GGG GCG CAG 


AAA 


ala leu 


asp 


val 


ala 


val 


leu ala ser ser 


thr gly his 


asp 


val 


glu 


gly ala gin 


lys 


243/81 












273/91 








AAC TTC 


ACC 


GCC 


CGC 


AAG 


TAC GAG CTG CAG 


ACG CGA CTG 


GCC 


GAC 


ACC 


GAC GTC ATC 


GCA 


asn phe 


thr 


ala 


arg 


lys 


tyr glu leu gin 


thr arg leu 


ala 


asp 


thr 


asp val ile 


ala 


303/101 












333/111 








GAC GTG 


CGG 


TCG 


GGA 


GTG 


AAC ACG CTG CTC 


AAC GGC GGT 


CAG 


GCG 


CTG 


CTG GAT AAG 


ATG 


asp val 


arg 


ser gly 


val 


asn thr leu leu 


asn gly gly 


gin 


ala 


leu 


leu asp lys 


met 


363/121 






















CTG GCC 


GAC 


AGC 


ATC 


GGC 


TTG CGG GAT C 














leu ala 


asp 


ser 


ile 


gly 


leu arg asp 















SEQ ID N° 21C 
FIGURE 21C 



< parti e de la sequence nucleotidique de seo21A 



1/1 


















31/11 










ACG ATC 


GCG 


CTT 


CTG 


CCG 


CTG 


GTA 


GTG 


GCG 


ATG GTG 


TTA 


GCA GGA TTG 


CGG GTC GAG 


GCT 


thr ile 


ala 


leu 


leu 


pro 


leu 


val 


val 


ala 


met val 


leu 


ala gly leu 


arg val glu 


ala 


61/21 


















91/31 






GCG ATG 


GCC 


AGC 


ACC 


AGC 


GGC 


CTG 


CGG 


CTG 


GTC GCC 


GCG 


CGC GCC GAA 


ATG ATA CCC 


GCG 


ala met 


ala 


ser 


thr 


ser 


gly 


leu 


arg 


leu 


val ala 


ala 


arg ala glu 


met ile pro 


ala 


121/41 


















151/51 






ATC ACG 


AAA 


TAC 


ATG 


TCG 


GCG 


CTG 


GAC 


GTC 


GCC GTG 


CTG 


GCC AGC TCG 


ACC GGA CAC 


GAT 


ile thr 


lys 


tyr 


met 


ser 


ala 


leu 


asp 


val 


ala val 


leu 


ala ser ser 


thr gly his 


asp 


181/61 


















211/71 






GTG GAG 


GGG 


GCG 


CAG 


AAA 


AAC 


TTC 


ACC 


GCC 


CGC AAG 


TAC 


GAG CTG CAG 


ACG CGA CTG 


GCC 


val glu 


gly 


ala 


gin 


lys 


asn 


phe 


thr 


ala 


arg lys 


tyr 


glu leu gin 


thr arg leu 


ala 


241/81 


















271/91 






GAC ACC 


GAC 


GTC 


ATC 


GCA 


GAC 


GTG 


CGG 


TCG 


GGA GTG 


AAC 


ACG CTG CTC 


AAC GGC GGT 


CAG 


asp thr 


asp 


val 


ile 


ala 


asp 


val 


arg 


ser 


gly val 


asn 


thr leu leu 


asn gly gly 


gin 


301/101 


















331/111 






GCG CTG 


CTG 


GAT 


AAG 


ATG 


CTG 


GCC 


GAC 


AGC 


ATC GGC 


TTG 


CGG GAT C 






ala leu 


leu 


asp 


lys 


met 


leu 


ala 


asp 


ser 


ile gly 


leu 


arg asp 







SEQ ID N° 21A 1 
FIGURE 21A' 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 




1/1 



uur\> J. ^VJ 




TTC 


TGC 




TtZfZ 


arg ser 


arg 


phe cys 


arg 


trp 


61/21 












CGA TGG 


CCA 


GCA 


CCA 


GCG 


GCC 


arg trp 


pro 


ala 


pro 


ala 


ala 


121/41 












TCA CGA 


AAT 


ACA 


TGT 


CGG 


CGC 


ser arg 


asn 


thr 


cys 


arg 


arg 


181/61 












TGG AGG 


GGG 


CGC AGA 


AAA 


ACT 


trp arg 


gly 


arg 


arg 


lys 


thr 


241/81 












ACA CCG 


ACG 


TCA 


TCG 


CAG 


ACG 


thr pro 


thr 


ser 


ser 


gin 


thr 


301/101 










CGC TGC 


TGG 


ATA AGA 


TGC 


TGG 


arg cys 


trp 


ile 


arg 


cys 


trp 


1/1 












CAC GAT 


CGC 


GCT 


TCT 


(zcr 


new 


his asp 


arq 


ala 


ser 


ala 


ala 


61/21 












TGC GAT 


GGC 


CAG 


CAC 


CAG 


CGG 


cys asp 


gly 


gin his 


gin 


arg 


121/41 












GAT CAC 


GAA 


ATA 


CAT 


GTC 


GGC 


asp his 


glu 


ile 


his 


val 


gly 


181/61 










TGT GGA 


GGG 


GGC 


GCA 


GAA 


AAA 


cys gly 


gly 


gly 


ala 


glu 


lys 


241/81 












CGA CAC 


CGA 


CGT 


CAT 


CGC 


AGA 


arg his 


arg 


arg 


his 


arg 


arg 


301/101 












GGC GCT 


GCT 


GGA 


TAA 


GAT 


GCT 


gly ala 


ala 


gly OCH 


asp 


ala 



80/185 



31/11 

TAG TGG CGA TGG TGT TAG 
AMB trp arg trp cys AMB 
91/31 

TGC GGC TGG TCG CCG CGC 
cys gly trp ser pro arg 
151/51 

TGG ACG TCG CCG TGC TGG 
trp thr ser pro cys trp 

211/71 
TCA CCG CCC GCA AGT ACG 
ser pro pro ala ser thr 

271/91 

TGC GGT CGG GAG TGA ACA 
cys gly arg glu OPA thr 

331/111 
CCG ACA GCA TCG GCT TGC 
pro thr ala ser ala cys 



SEQ ID N° 21B» 
FIGURE 21B' 









31/11 




GGT 


AGT 


GGC 


GAT GGT 


GTT 


gly 


ser 


gly 


asp gly val 








91/31 




CCT 


GCG 


GCT 


GGT CGC 


CGC 


pro 


ala 


ala 


gly arg 


arg 








151/51 




GCT 


GGA 


CGT 


CGC CGT 


GCT 


ala gly 


arg 


arg arg 


ala 








211/71 




CTT 


CAC 


CGC 


CCG GAA 


GTA 


leu 


his 


arg 


pro gin 


val 








271/91 




CGT 


GCG 


GTC 


GGG AGT 


GAA 


arg 


ala 


val 


gly ser 


glu 








331/111 




GGC 


CGA 


CAG 


CAT CGG 


CTT 


gly arg 


gin 


his arg 


leu 




SEQ 


ID 


N° 21C 


i 



FIGURE 21C 



CAG 


GAT 


TGC 


GGG 


TCG 


AGG 


CTG 


gin 


asp 


cys 


gly 


ser 


arg 


leu 


GCG 


CCG 


AAA 


TGA 


TAC 


CCG 


CGA 


ala 


pro lys 


OPA 


tyr 


pro 


arg 


CCA 


GCT 


CGA 


CCG 


GAC 


ACG 


ATG 


pro 


ala 


arg 


pro 


asp 


thr 


met 


AGC 


TGC AGA 


CGC 


GAC 


TGG 


CCG 


ser 


cys 


arg 


arg 


asp 


trp 


pro 


CGC 


TGC 


TCA 


ACG 


GCG 


GTC 


AGG 


arg 


cys 


ser 


thr 


ala 


val 


arg 


GGG 


ATC 












gly 


ile 












AGC 


AGG 


ATT 


GCG 


GGT 


CGA 


GGC 


ser 


arg 


ile 


ala 


gly 


arg 


gly 


GCG 


CGC 


CGA 


AAT 


GAT 


ACC 


CGC 


ala 


arg 


arg 


asn 


asp 


thr 


arg 


GGC 


CAG 


CTC 


GAC 


CGG 


ACA 


CGA 


gly 


gin leu 


asp 


arg 


thr 


arg 


CGA 


GCT 


GCA 


GAC 


GCG 


ACT 


GGC 


arg 


ala 


ala 


asp 


ala 


thr 


gly 


CAC 


GCT 


GCT 


CAA 


CGG 


CGG 


TCA 


his 


ala 


ala 


gin 


arg 


arg 


ser 



GCG GGA TC 
ala gly 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 




»CT/FR98/01813 



81/185 



sequence Rv3365c predite par Cole et 
Seq2iA f 



1/1 



gtg acc 
val thr 
61/21 


atg 
met 


ttc 
phe 


gcc 
ala 


cgc 
arg 


ccg 
pro 


acc 
thr 


ate 
ile 


ccg 
pro 


ccg get 
pro ala 
121/41 


caa 
gin 


ccg 
pro 


gcc 
ala 


cgc 
arg 


ggc 
gly 


aaa 
lys 


cct 
pro 


caa 
gin 


tgg ccg 
trp pro 
181/61 


gtc 
val 


cga 
arg 


tgg 
trp 


aaa 
lys 


gtg 

3 3> 

val 


ttc 
phe 


acg 
thr 


ate 
ile 


tta gca 
leu ala 
241/81 


gga 
gly 


ttg 
leu 


egg 
arg 


gtc 
val 


aaa 
glu 


get 
ala 


aca 
ala 


atg 
met 


gcg cgc 
ala arg 
301/101 


gcc 
ala 


gaa 
glu 


atg 
met 


ata 
ile 


ccc 
pro 


gcg 
ala 


ate 
ile 


acg 
thr 


ctg gcc 
leu ala 
361/121 


age 
ser 


teg 
ser 


acc 
thr 


gga 
gly 


cac 
his 


gat 
asp 


gtg 
val 


gag 

3 3 

glu 


tac gag 
tyr glu 
421/141 


ctg 
leu 


cag 
gin 


acg 
thr 


cga 
arg 


ctg 
leu 


gcc 
ala 


gac 
asp 


acc 
thr 


aac acg 
asn thr 
481/161 


ctg 
leu 


etc 
leu 


aac 
asn 


ggc 
gly 


ggt 
gly 


cag 
gin 


gcg 
ala 


ctg 
leu 


ttg egg 
leu arg 
.541/181 


gat 
asp 


egg 
arg 


gtc 
val 


acc 
thr 


gcc 
ala 


tac 
tyr 


ala 


ccg 
pro 


gcg teg 
ala ser 
601/201 


gtg 
val 


egg 
arg 


gtt 
val 


gac 
asp 


age 
ser 


gag 
glu 


caa 
gin 


ate 
ile 


gtt ggc 
val gly 
661/221 


gcc 
ala 


cgc 
arg 


999 
gly 


cag 
gin 


atg 
met 


acg 
thr 


atg 
met 


cag 
gin 


gcc gag 
ala glu 
721/241 


ccg 
pro 


caa 
gin 


ctg 
leu 


cgc 
arg 


age 
ser 


gcg 
ala 


atg 
met 


gtt 
val 


ttc ggg 
phe gly 
781/261 


atg 
met 


age 
ser 


gcg 
ala 


gcg 
ala 


etc 
leu 


ggt 
gly 


gca 
ala 


ggc 
gly 


atg gtg 
met val 
841/281 


acc 
thr 


agg 
arg 


atg 
met 


gcg 
ala 


ate 
ile 


atg 

met 


tec 
ser 


gat 
asp 


ctg ctg 
leu leu 
901/301 


cac 
his 


teg 
ser 


ata 
ile 


cag 
gin 


ate 
ile 


acc 
thr 


cgc 
arg 


gac 
asp 


gag gcg 
glu ala 
961/321 


gtg 
val 


acg 
thr 


aag 
lys 


teg 
ser 


gtg 
val 


caa 
gin 


age 
ser 


cag 
gin 


gac gcc 
asp ala 


gtg 
val 


ctg 
leu 


gtg 

val 


ttg 
leu 


gcc 
ala 


gcc 
ala 


ate 
ile 


gcg 
ala 



al. (Nature 393:537-544) et contenant 



31/11 


















gtc gcg 
val ala 
91/31 


gcg 
ala 


gcc 
ala 


get 
ala 


tct 
ser 


gat 
asp 


att 
ile 


tec 
ser 


gcc 
ala 


caa cgc 
gin arg 
151/51 


ccg 
pro 


ccg 
pro 


tec 
ser 


tgg 
trp 


teg 
ser 


ccg 
pro 


cgc 
arg 


aac 
asn 


gcg ctt 
ala leu 
211/71 


ctg 
leu 


ccg 
pro 


ctg 
leu 


gta 
val 


gtg 
val 


gcg 
ala 


atg 
met 


gtg 

val 


gcc age 
ala ser 
271/91 


acc 
thr 


age 
ser 


ggc 
alv 

3J Jr 


ctg 
leu 


egg 
arg 


ctg 
leu 


gtc 

Val 


gcc 

did 


aaa tac 
lys tyr 
331/111 


atg 
met 


teg 
ser 


gcg 
ala 


ctg 
leu 


gac 
asp 


gtc 
val 


gcc 
ala 


gtg 
val 


ggg gcg 

gly ala 
391/131 


cag 
gin 


aaa 
lys 


aac 
asn 


ttc 
phe 


acc 
thr 


gcc 
ala 


cgc 
ara 


aag 
lvs 


gac gtc 
asp val 
451/151 


ate 
ile 


gca 
ala 


gac 
asp 


gtg 
val 


egg 
are 


teg 
ser 


gga 
alv 


gtg 
val 


ctg gat 
leu asp 
511/171 


aag 
lys 


gtg 
val 


ctg 
leu 


gcc 
ala 


gac 
asp 


age 
ser 


ate 
ile 


ggc 


ctg ctg 
leu leu 
571/191 


ttg 
leu 


acg 
thr 


gcc 
ala 


cag 
gin 


aac 
asn 


gtg 
val 


att 
ile 


gac 
asp 


cga acc 
arg thr 
631/211 


cag 
gin 


gtg 
val 


cag 
gin 


ggt 
gly 


ttg 
leu 


age 
ser 


cga 
arg 


gcc 
ala 


gag ate 
glu ile 
691/231 


ctg 
leu 


gtg 
val 


act 
thr 


cgc 
arg 


ggc 
glv 


gcc 
ala 


gac 
asn 


ctt 
leu 


acc ctg 
thr leu 
751/251 


gcc 
ala 


ggc 

gly 


acc 
thr 


gaa 
glu 


ccc 
pro 


teg 
ser 


acg 
thr 


eta 
leu 


teg ccg 
ser pro 
811/271 


gac 
asp 


acc 
thr 


aag 
lys 


aac 
asn 


ctg 
leu 


cag 
gin 


cag 
gin 


caa 
gin 


ccg gcc 
pro ala 
871/291 


gtt 
val 


gca 
ala 


ctg 
leu 


gtc 
val 


aac 
asn 


aac 
asn 


cca 
pro 


gag 
glu 


att gcc 
ile ala 
931/311 


gag 
glu 


cag 
gin 


gtg 
val 


ate 
ile 


acc 
thr 


gac 
asp 


acc 
thr 


acc 
thr 


gcc acc 
ala thr 
991/331 


gac 
asp 


egg 
arg 


egg 
arg 


gat 
asp 


gcc 
ala 


gcg 
ala 


att 
ile 


cgc 
arg 


acc gcg 
thr ala 


ate 
ile 


gtc 
val 


gtc 
val 


gtg 
val 


ttg 
leu 


gtg 
val 


gtg 
val 


gcg 
ala 
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1021/341 

cgc acg ctg gtc ggg ccg atg egg gta ctg 
arg thr leu val gly pro met arg val leu 
1081/361 

gat etc gac ggc gag ate gcg gcg gtc cgc 
asp leu asp gly glu ile ala ala val arg 
1141/381 

gcg gtg tac acc ace gag gaa ate ggt cag 
ala val tyr thr thr glu glu ile gly gin 
1201/401 

egg gec ctg ttg ctg gec ggc gag gaa acg 
arg ala leu leu leu ala gly glu glu thr 
1261/421 

gag acc atg teg egg cgt age cgt tec ctg 
glu thr met ser arg arg ser arg ser leu 
1321/441 

ctg gag cgc aac gag gag gat ccc gec cga 
leu glu arg asn glu glu asp pro ala arg 
1381/461 

gee gec egg ctg cgc cgc aac age gec aac 
ala ala arg leu arg arg asn ser ala asn 
1441/481 

cgt gac cac cgc gag ccg gtg ccg ctg tea 
arg asp his arg glu pro val pro leu ser 
1501/501 

gag gac tat cgc cgc gtc gac ate gcg agg 
glu asp tyr arg arg val asp ile ala arg 
1561/521 

get ggt ggc gtc att cat ctg ctt gec gag 
ala gly gly val ile his leu leu ala glu 
1621/541 

ccg acc acaccc gtt egg gtt gec gec gca 
pro thr thr pro val arg val ala ala ala 
1681/561 

ate teg gat tec ggc ctg ggc atg acc gat 
ile ser asp ser gly leu gly met thr asp 
1741/581 

egg gee ggc ggt gag gtc acc ccg gat agt 
arg ala gly gly glu val thr pro asp ser 
1801/601 

egg ctg gec ggt egg cac ggc ate cga gtc 
arg leu ala gly arg his gly ile arg val 
1861/621 

ggc acc ggc acc acc gee gag gtc tac ctg 
gly thr gly thr thr ala glu val tyr leu 
1921/641 

gcg cag ccg cca aag ccg egg gta ttt gcg 
ala gin pro pro lys pro arg val phe ala 
1981/661 

gec gat ccg acg gac gtt ccc gee gec ate 
ala asp pro thr asp val pro ala ala ile 



1051/351 

cgt gat ggg gcg etc aag gtt get cat acc 
arg asp gly ala leu lys val ala his thr 
1111/371 

gec ggc gac gag ccg ate ccc gag cca ctg 
ala gly asp glu pro ile pro glu pro leu 
1171/391 

gtc gcg cat gcg gtc gac gag ctg cac acc 
val ala his ala val asp glu leu his thr 
1231/411 

egg ttg cga ctg ctg gtc aac gag atg ttt 
arg leu arg leu leu val asn glu met phe 
1291/431 

gtc gac cag cag ctg teg gtc ate gac caa 
val asp gin gin leu ser val ile asp gin 
1351/451 

etc gac age ctt ttc egg etc gat cac ctg 
leu asp ser leu phe arg leu asp his leu 
1411/471 

ctg ctg gtg ctg gee ggt gcg cag att acc 
leu leu val leu ala gly ala gin ile thr 
1471/491 

acc gtg ate age gee gec gtg tea gag gtc 
thr val ile ser ala ala val ser glu val 
1531/511 

gta ccc gac tgt gcg gta gtc ggc gca gcg 
val pro asp cys ala val val gly ala ala 
1591/531 

ctg ate gac aac gcg ttg cgc tac teg tea 
leu ile asp asn ala leu arg tyr ser ser 
1651/551 

ate ggc age gaa ggc agt gtt ctg ctg cga 
ile gly ser glu gly ser val leu leu arg 
1711/571 

gee gat egg egg atg gee aat atg egg ctg 
ala asp arg arg met ala asn met arg leu 
1771/591 

gec egg cac atg ggt ctg ttc gta gtc ggc 
ala arg his met gly leu phe val val gly 
1831/611 

ggg ctg cgc ggt ccg gtg acc ggt gaa cag 
gly leu arg gly pro val thr gly glu gin 
1891/631 

ccg eta gec gtg etc gag ggg acg gee cca 
pro leu ala val leu glu gly thr ala pro 
1951/651 

ate aag ccg ccg tgt cct gaa ccc gcg gcg 
ile lys pro pro cys pro glu pro ala ala 
2011/671 

ggg ccg eta cca ccg gtc acg ttg etc ccg 
gly pro leu pro pro val thr leu leu pro 
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2041/681 

cgc cgt acc ccg ggg tec agt ggc ate gec 
arg arg thr pro gly ser ser gly ile ala 
2101/701 

egg cgc gag ctg aaa aca ccc tgg tgg gag 
arg arg glu leu lys thr pro trp trp glu 
2161/721 

ccc gca cca gaa ccg cga ccg gcg ccg ccg 
pro ala pro glu pro arg pro ala pro pro 
2221/741 

gtt gat gac gac gtc ate tac egg egg atg 
val asp asp asp val ile tyr arg arg met 
2281/761 

ctg gee cac age ccc gat ctg gac tgg aag 
leu ala his ser pro asp leu asp trp lys 
2341/781 

gec gag gec gcg gac aag ccc gtg cag tec 
ala glu ala ala asp lys pro val gin ser 
2401/801 

ccc ggg gee egg tta gtg ccg ggg gcg gcg 
pro gly ala arg leu val pro gly ala ala 
2461/821 

ggt gca gcg eta gca tec aac ggc gga ctt 
gly ala ala leu ala ser asn gly gly leu 
25217841 

gcg gta cgc gac ccc gac gcg gtt cgt gee 
ala val arg asp pro asp ala val arg ala 
2581/861 

acc ggg egg teg cat gec cgc gag age agt 
thr gly arg ser his ala arg glu ser ser 



2071/691 

gac gtc ccg gec cag ccg atg cag cag egg 
asp val pro ala gin pro met gin gin arg 
2131/711 

gat agg ttt caa cag gag ccc aaa caa ccg 
asp arg phe gin gin glu pro lys gin pro 
2191/731 

ccc gec aaa ccc gcg cca ccg gcg ggc ccg 
pro ala lys pro ala pro pro ala gly pro 
2251/751 

etc tec gag atg gtg ggt gac ccg cac gag 
leu ser glu met val gly asp pro his glu 
2311/771 

teg gtg tgg gac cac ggc tgg teg gcg gec 
ser val trp asp his gly trp ser ala ala 
2371/791 

cgc acg gac tac ggc ctg ccg gtg cgc gaa 
arg thr asp tyr gly leu pro val arg glu 
2431/811 

gtg cct gag gga ccc gat egg gag cat ccg 
val pro glu gly pro asp arg glu his pro 
2491/831 

cat ccc ggc cga gcg ccg egg cac gcg get 
his pro gly arg ala pro arg his ala ala 
2551/851 

tec ate age age cat ttc ggc ggc gtg cgc 
ser ile ser ser his phe gly gly val arg 
2611/871 

cag gga ccc aac cag caa tga 
gin gly pro asn gin gin OPA 
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ORF cTapres par Cole et al. 
1/1 

taa ggg tgc ggc egg tgg cac 
OCH gly cys gly arg trp his 
61/21 

ccg gtc gcg gcg gcc get tct 
pro val ala ala ala ala ser 
121/41 

cag caa cgc ccg ccg tec tgg 
gin gin arg pro pro ser trp 
181/61 

ate gcg ctt ctg ccg ctg gta 
ile ala leu leu pro leu val 
241/81 

atg gcc age acc age ggc ctg 
met ala ser thr ser gly leu 
301/101 

acg aaa tac atg teg gcg ctg 
thr lys tyr met ser ala leu 
361/121 

gag ggg gcg cag aaa aac ttc 
glu gly ala gin lys asn phe 
421/141 

acc gac gtc ate gca gac gtg 
thr asp val ile ala asp val 
48.1/161 

ctg ctg gat aag gtg ctg gcc 
leu leu asp lys val leu ala 
541/181 

ccg ctg ctg ttg acg gcc cag 
pro leu leu leu thr ala gin 
601/201 

ate cga acc cag gtg cag ggt 
ile arg thr gin val gin gly 
661/221 

cag gag ate ctg gtg act cgc 
gin glu ile leu val thr arg 
721/241 

gtt acc ctg gcc ggc acc gaa 
val thr leu ala gly thr glu 
781/261 

ggc teg ccg gac acc aag aac 
gly ser pro asp thr lys asn 
841/281 

gat ccg gcc gtt gca ctg gtc 
asp pro ala val ala leu val 



(Nature 393:537-544) et 
31/11 

ggc cgc ggc cac gtg acc 
gly arg gly his val thr 
91/31 

gat att tec gcc ccg get 
asp ile ser ala pro ala 

151/51 
teg ccg cgc aac tgg ccg 
ser pro arg asn trp pro 

211/71 
gtg gcg atg gtg tta gca 
val ala met val leu ala 

271/91 
egg ctg gtc gcc gcg cgc 
arg leu val ala ala arg 

331/111 
gac gtc gcc gtg ctg gcc 
asp val ala val leu ala 

391/131 
acc gcc cgc aag tac gag 
thr ala arg lys tyr glu 

451/151 
egg teg gga gtg aac acg 
arg ser gly val asn thr 

511/171 
gac age ate ggc ttg egg 
asp ser ile gly leu arg 

571/191 
aac gtg att gac gcg teg 
asn val ile asp ala ser 

631/211 
ttg age cga gcc gtt ggc 
leu ser arg ala val gly 

691/231 
ggc gcc gac ctt gcc gag 
gly ala asp leu ala glu 

751/251 
ccc teg acg ctg ttc ggg 
pro ser thr leu phe gly 

811/271 
ctg cag cag caa atg gtg 
leu gin gin gin met val 

871/291 
aac aac cca gag ctg ctg 
asn asn pro glu leu leu 



SEQ ID N° 21F 
FIGURE 21F 



contennant Rv3365c 



atg 

met 


ttc 
phe 


gcc 
ala 


cgc 
arg 


ccg 
pro 


acc ate 
thr ile 


caa 
gin 


ccg 
pro 


gcc 
ala 


cgc 
arg 


ggc 
gly 


aaa cct 
lys pro 


gtc 
val 


cga 
arg 


tgg aaa 
trp lys 


gtg 
val 


ttc acg 
phe thr 


gga 
gly 


ttg 
leu 


egg 
arg 


gtc 
val 


gag 
glu 


get gcg 
ala ala 


gcc 
ala 


gaa 
glu 


atg 

met 


ata 
ile 


ccc 
pro 


gcg ate 
ala ile 


age 
ser 


teg 
ser 


acc gga 
thr gly 


cac 
his 


gat gtg 
asp val 


ctg 
leu 


cag 
gin 


acg 
thr 


cga 
arg 


ctg 
leu 


gcc gac 
ala asp 


ctg 
leu 


etc 
leu 


aac 
asn 


ggc 

giy 


ggt 

gly 


cag gcg 
gin ala 


gat 
asp 


egg 
arg 


gtc 
val 


acc 
thr 


gcc 
ala 


tac gcg 
tyr ala 


gtg 
val 


egg 
arg 


gtt 
val 


gac 
asp 


age 
ser 


gag caa 
glu gin 


gcc 
ala 


cgc 
arg 


ggg cag 
gly gin 


atg 
met 


acg atg 
thr met 


ccg 
pro 


caa 
gin 


ctg 
leu 


cgc 
arg 


age 
ser 


gcg atg 
ala met 


atg 
met 


age 
ser 


gcg 
ala 


gcg 
ala 


etc 
leu 


ggt gca 
gly ala 


acc 
thr 


agg 
arg 


atg gcg 
met ala 


ate 
ile 


atg tec 
met ser 


cac 
his 


teg 
ser 


ata 
ile 


cag 
gin 


ate 
ile 


acc cgc 
thr arg 
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901/301 








gac att gcc 


gag 


cag 


gtg 


asp ile ala 


glu gin 


val 


961/321 








cag gcc acc 


gac 


egg 


egg 


gin ala thr 


asp 


arg 


arg 


1021/341 








gcg acc gcg 


ate 


gtc 


gtc 


ala thr ala 


ile 


val 


val 


1081/361 








ctg cgt gat 


ggg 


gcg 


etc 


leu arg asp 


gly ala 


leu 


1141/381 








cgc gcc ggc 


gac 


gag 


ccg 


arg ala gly 


asp glu 


pro 


1201/401 








cag gtc gcg 


cat 




gtc 


gin val ala 


his 


ala 


val 


1261/421 








acg egg ttg 


cga 


ctg 


ctg 


thr arg leu 


arg 


leu 


leu 


1321/441 








ctg gtc gac 


cag 


cag 


ctg 


leu val asp 


gin 


gin 


leu 


1381/461 






cga etc gac 


age 


ctt 


ttc 


arg leu asp 


ser 


leu 


phe 


1441/481 






aac ctg ctg 


gtg 


ctg 


gcc 


asn leu leu 


val 


leu 


ala 


1501/501 








tea acc gtg 


ate 


age 


gcc 


ser thr val 


ile 


ser 


ala 


1561/521 








agg gta ccc 


gac 


tgt 


gcg 


arg val pro 


asp 


cys 


ala 


1621/541 








gag ctg ate 


gac 


aac 


gcg 


glu leu ile 


asp 


asn 


ala 


1681/561 






gca ate ggc 


age 


gaa 


ggc 


ala ile gly 


ser 


glu 


gly 


1741/581 








gat gcc gat 


egg 


egg 


atg 


asp ala asp 


arg 


arg 


met 


1801/601 






agt gcc egg 


cac 


atg 


ggt 


ser ala arg 


his 


met 


gly 



931/311 
ate acc gac acc acc gag gcg 
ile thr asp thr thr glu ala 

991/331 
gat gcc gcg att cgc gac gcc 
asp ala ala ile arg asp ala 

1051/351 
gtg ttg gtg gtg gcg cgc acg 
val leu val val ala arg thr 

1111/371 
aag gtt get cat acc gat etc 
lys val ala his thr asp leu 

1171/391 
ate ccc gag cca ctg gcg gtg 
ile pro glu pro leu ala val 

1231/411 
gac gag ctg cac acc egg gcc 
asp glu leu his thr arg ala 

1291/431 
gtc aac gag atg ttt gag acc 
val asn glu met phe glu thr 

1351/451 
teg gtc ate gac caa ctg gag 
ser val ile asp gin leu glu 

1411/471 
egg etc gat cac ctg gcc gcc 
arg leu asp his leu ala ala 

• 1471/491 
ggt gcg cag att acc cgt gac 
gly ala gin ile thr arg asp 

1531/511 
gcc gtg tea gag gtc gag gac 
ala val ser glu val glu asp 

1591/531 
gta gtc ggc gca gcg get ggt 
val val gly ala ala ala gly 

1651/551 
ttg cgc tac teg tea ccg acc 
leu arg tyr ser ser pro thr 

1711/571 
agt gtt ctg ctg cga ate teg 
ser val leu leu arg ile ser 

1771/591 
gcc aat atg egg ctg egg gcc 
ala asn met arg leu arg ala 

1831/611 
ctg ttc gta gtc ggc egg ctg 
leu phe val val gly arg leu 



SEQ ID N° 21F {suite 
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gtg acg aag 
val thr lys 


teg 
ser 


gtg 

val 


caa 
gin 


age 
ser 


gtg 
val 


ctg gtg 
leu val 


ttg 
leu 


gcc 
ala 


gcc 
ala 


ate 
ile 


ctg 
leu 


gtc ggg 
val gly 


ccg 
pro 


atg 
met 


egg 
arg 


gta 
val 


gac ggc gag 
asp gly glu 


ate 
ile 


gcg 
ala 


gcg 
ala 


gtc 
val 


tac 
tyr 


acc acc 
thr thr 


gag 
glu 


gaa 
glu 


ate 
ile 


ggt 
gly 


ctg 
leu 


ttg ctg 
leu leu 


gcc 
ala 


ggc 
gly 


gag gaa 
glu glu 


atg teg egg 
met ser arg 


cgt 
arg 


age 
ser 


cgt 
arg 


tec 
ser 


cgc 
arg 


aac gag 
asn glu 


gag 
glu 


gat 
asp 


ccc 
pro 


gcc 
ala 


egg 
arg 


ctg cgc 
leu arg 


cgc 
arg 


aac 
asn 


age 
ser 


gcc 
ala 


cac 
his 


cgc gag 
arg glu 


ccg 
pro 


gtg 
val 


ccg 
pro 


ctg 
leu 


tat 
tyr 


cgc cgc 
arg arg 


gtc 
val 


gac 
asp 


ate 
ile 


gcg 
ala 


ggc gtc att 
gly val ile 


cat 
his 


ctg 
leu 


ctt 
leu 


gcc 
ala 


aca 
thr 


ccc gtt 
pro val 


egg 
arg 


gtt 
val 


gcc 
ala 


gcc 
ala 


gat 
asp 


tec ggc 
ser gly 


ctg 
leu 


ggc 
gly 


atg 
met 


acc 
thr 


ggc ggt gag 
gly gly glu 


gtc 
val 


acc 
thr 


ccg 
pro 


gat 
asp 


gcc 
ala 


ggt egg 
gly arg 


cac 
his 


ggc 
gly 


ate 
ile 


cga 
arg 



1) 
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1B61/621 



1891/631 



gtc ggg ctg cgc ggt ccg gtg acc ggt gaa cag ggc acc ggc acc acc gcc gag gtc tac 
val gly leu arg gly pro val thr gly glu gin gly thr gly thr thr ala glu val tyr 
1921/641 1951/651 

ctg ccg eta gcc gtg etc gag ggg acg gcc cca gcg cag ccg cca aag ccg egg gta ttt 
leu pro leu ala val leu glu gly thr ala pro ala gin pro pro lys pro arg val phe 
1981/661 2011/671 

gcg ate aag ccg ccg tgt cct gaa ccc gcg gcg gcc gat ccg acg gac gtt ccc gcc gcc 
ala ile lys pro pro cys pro glu pro ala ala ala asp pro thr asp val pro ala ala 
2041/681 2071/691 

ate ggg ccg eta cca ccg gtc acg ttg etc ccg cgc cgt acc ccg ggg tec agt ggc ate 
ile gly pro leu pro pro val thr leu leu pro arg arg thr pro gly ser ser gly ile 
2101/701 2131/711 

gcc gac gtc ccg gcc cag ccg atg eag cag egg egg cgc gag ctg aaa aca ccc tgg tgg 
ala asp val pro ala gin pro met gin gin arg arg arg glu leu lys thr pro trp trp 
2161/721 2191/731 

gag gat agg ttt caa cag gag ccc aaa caa ccg ccc gca cca gaa ccg cga ccg gcg ccg 
glu asp arg phe gin gin glu pro lys gin pro pro ala pro glu pro arg pro ala pro 
2221/741 2251/751 

ccg ccc gcc aaa ccc gcg cca ccg gcg ggc ccg gtt gat gac gac gtc ate tac egg egg 
pro pro ala lys pro ala pro pro ala gly pro val asp asp asp val ile tyr arg arg 
2281/761 2311/771 * " 

atg etc tec gag atg gtg ggt gac ccg cac gag ctg gcc cac age ccc gat ctg gac tgg 
met leu ser glu met val gly asp pro his glu leu ala his ser pro asp leu asp trp 
2341/781 2371/791 

aag teg gtg tgg gac cac ggc tgg teg gcg gcc gcc gag gcc gcg gac aag ccc gtg cag 
lys ser val trp asp his gly trp ser ala ala ala glu ala ala asp lys pro val gin 
2401/801 2431/811 

tec cgc acg gac tac ggc ctg ccg gtg cgc gaa ccc ggg gcc egg tta gtg ccg ggg gcg 
ser arg thr asp tyr gly leu pro val arg glu pro gly ala arg leu val pro gly ala 
2461/821 2491/831 

gcg gtg cct gag gga ccc gat egg gag cat ccg ggt gca gcg eta gca tec aac ggc gga 
ala val pro glu gly pro asp arg glu his pro gly ala ala leu ala ser asn gly gly 
2521/841 2551/851 

ctt cat ccc ggc cga gcg ccg egg cac gcg get gcg gta cgc gac ccc gac gcg gtt cgt 
leu his pro gly arg ala pro arg his ala ala ala val arg asp pro asp ala val arg 
2581/861 2611/871 

gcc tec ate age age cat ttc ggc ggc gtg cgc acc ggg egg teg cat gcc cgc gag age 
ala ser ile ser ser his phe gly gly val arg thr gly arg ser his ala arg glu ser 
2641/881 

agt cag gga ccc aat cag caa tga 
ser gin gly pro asn gin gin OPA 
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31/11 



CTA CGA 


CAA GGC AAA GGA GCA CAG 


GGT 


GAA 


GCG TGG 


ACT 


GAC 


GGT 


CGC 


GGT 


AGC 


CGG 


AGC 


leu arg 


gin gly lys gly ala gin gly 


glu 


ala trp 


thr 


asp 


gly 


arg 


gly 


ser 


ara 


ser 


61/21 








91/31 












CGC CAT 


TCT GGT CGC AGG TCT TTC 


CGG 


ATG 


TTC AAG 


CAA 


CAA 


GTC 


GAC 


TAC 


AGG 


AAG 


CGG 


arg his 


ser gly arg arg ser phe arg 


met 


phe lys 


gin gin 


val 


asp 


tvr 


ara 


lvs 


arg 


121/41 








151/51 








TGA GAC 


CAC GAC CGC GGC AGG CAC 


GAC 


GGC 


AAG CCC 


CGG 


CGC 


CGC 


ATC 


CGG 


GCC 


GAA 


GGT 


OP A asp 


his asp arg gly arg his 


asp 


gly 


lys pro 


arg 


arg 


arg 


ile 


arg 


ala 


glu 


gly 


181/61 








211/71 












CGT CAT 


CGA CGG TAA GGA CCA GAA 


CGT 


CAC 


CGG GTC 


TGT 


GGT 


GTG 


CAC 


AAC 


CGC 


GGC 


CGG 


arg his 


arg arg OCH gly pro glu arg 


his 


arg val 


cys 


gly 


val 


his 


asn 


arg 


gly 


arg 


241/81 








271/91 












CAA TGT 


CAA CAT CGC GAT CGG CGG 


GGC 


GGC 


GAC CGG 


CAT 


TGC 


CGC 


CGT 


GCT 


CAC 


CGA 


CGG 


gin cys 


gin his arg asp arg arg gly 


gly 


asp arg 


his 


cys 


arg 


arg 


ala 


his 


arg 


arg 


301/101 








331/111 














TCC GGA GGT GAA GTC CGT 


TGG 


GCT 


CGG TAA 


CGT 


CAA 


CGG 


CGT 


CAC 


GCT 


GGG 


ATA 


vjJLil £JJCU 


ser gly gly glu val arg 


trp 


ala 


arg OCK 


arg gin 


arg 


arg 


his 


ala 


gly 


ile 


/ lOI 
O 0±/ S-£. X 








391/131 












Pip prpp 


GGG CAC CGG ACA GGG TAA 


CGC 


TCG 


GCA ACC 


AAG 


GAC 


GGC 


AGC 


CAC 


TAC 


AAG 


ATC 




gly his arg thr gly OCH 


arg 


ser 


ala thr 


lys 


asp 


gly 


ser 


his 


tyr 


lys 


ile 
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32/11 


















TAC GAC 


AAG GCA AAG GAG CAC AGG 


GTG 


AAG 


CGT GGA 


CTG 


ACG 


GTC 


GCG 


GTA 


GCC 


GGA 


GCC 


tyr asp 


lys .ala lys glu his arg 


val 


lys 


arg gly 


leu 


thr 


val 


ala 


val 


ala 


qly 


ala 


62/21 








92/31 
















GCC ATT 


CTG GTC GCA GGT CTT TCC 


GGA 


TGT 


TCA AGC 


AAC 


AAG 


TCG 


ACT 


ACA 


GGA 


AGC 


GGT 


ala ile 


leu val ala gly leu ser 


gly 


cys 


ser ser 


asn 


lys 


ser 


thr 


thr 


crlv 


ser 


gly 


122/41 








152/51 














GAG ACC 


ACG ACC GCG GCA GGC ACG 


ACG 


GCA 


AGC CCC 


GGC 


GCC 


GCA 


TCC 


GGG 


CCG 


AAG 


GTC 


glu thr 


thr thr ala ala gly thr thr 


ala 


ser pro 


gly ala 


ala 


ser 


gly 


pro 


lys 


val 


182/61 








212/71 












GTC ATC 


GAC GGT AAG GAC CAG AAC 


GTC 


ACC 


GGG TCT 


GTG 


GTG 


TGC 


ACA 


ACC 


GCG 


GCC 


GGC 


val ile 


asp gly lys asp gin asn 


val 


thr 


gly ser 


val 


val 


cys 


thr 


thr 


ala 


ala 


gly 


242/81 








272/91 














AAT GTC 


AAC ATC GCG ATC GGC GGG 


GCG 


GCG 


ACC GGC 


ATT 


GCC 


GCC 


GTG 


CTC 


ACC 


GAC 


GGC 


asn val 


asn ile ala ile gly gly ala 


ala 


thr gly 


ile 


ala 


ala 


val 


leu 


thr 


asp 


gly 


302/101 








332/111 
















AAC CCT 


CCG GAG GTG AAG TCC GTT 


GGG 


CTC 


GGT AAC 


GTC 


K\C 


GGC 


GTC 


ACG 


CTG 


GGA 


TAC 


asn pro 


pro glu val lys ser val 


gly 


leu 


gly asn 


val 


asn 


gly 


val 


thr 


leu 


gly 


tyr 


362/121 








392/131 












ACG TCG 


GGC ACC GGA CAG GGT AAC 


GCT 


CGG 


CAA CCA 


AGG 


ACG 


GCA 


GCC 


ACT 


ACA 


AGA 


TC 


thr ser 


gly thr gly gin gly asn 


ala 


arg 


gin pro 


arg 


thr 


ala 


ala 


thr 


thr 


arg 



SEQ ID N° 22B 
FIGURE 22B 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCI7FR98/01813 



ACG ACA 


AGG 


CAA 


AGG 


AGC 


ACA 


thr thr 


arg gin 


arg 


ser 


thr 


63/21 












CCA TTC 


TGG 


TCG 


CAG 


GTC 


TTT 


pro phe 


trp 


ser 


gin 


val phe 


123/41 












AGA CCA 


CGA 


CCG 


CGG 


CAG 


GCA 


arg pro 


arg 


pro 


arg 


gin 


ala 


183/61 












TCA TCG 


ACG 


GTA 


AGG 


ACC 


AGA 




thr 


val 


a rg 


thr 


arg 


243/81 












ATG TCA 


ACA TCG 


CGA 


TCG 


GCG 


met ser 


thr 


ser 


arg 


ser 


ala 


303/101 










ACC CTC 


CGG AGG 


TGA 


AGT 


CCG 


thr leu 


arg 


arg 


OPA 


ser 


pro 


363/121 












CGT CGG 


GCA 


CCG 


GAC 


AGG 


GTA 


arg arg 


ala 


pro 


asp 


arg 


val 


GCA CAA 


CCG 


CGG 


CCG 


GCA 


ATG 


ala gin 


pro 


arg 


pro 


ala 


met 


61/21 












CCG TGC 


TCA 


CCG 


ACG 


GCA ACC 


pro cys 


ser 


pro 


thr 


ala 


thr 


121/41 












GCG TCA 


CGC 


TGG 


GAT 


ACA 


CGT 


ala ser 


arg 


trp asp 


thr 


arg 


181/61 












GCA GCC 


ACT 


ACA 


AGA 


TCA 


CAG 


ala ala 


thr 


thr 


arg 


ser 


gin 


241/81 












CAT TCT 


GGT 


CGC 


AGG 


TCT 


TTC 


his ser 


gly 


arg 


arg 


ser phe 


301/101 












GAC CAC 


GAC 


CGC 


GGC 


AGG 


CAC 


asp his 


asp 


arg gly 


arg 


his 


361/121 












ATC GAC 


GGT 


AAG 


GAC 


CAG 


AAC 


ile asp 


gly 


lys 


asp 


gin 


asn 


421/141 












GTC AAC 


ATC 


GCG 


ATC 


GGC 


GGG 


val asn 


ile 


ala 


ile 


gly gly 


481/161 












CCT CCG 


GAG 


GTG 


AAG 


TCC 


GTT 


pro pro 


glu 


val 


lys 


ser 


val 


541/181 












TCG GGC 


ACC 


GGA 


CAG 


GGT 


AAC 


ser gly 


thr 


gly gin 


gly 


asn 



88/185 



33/11 

GGG TGA AGC GTG GAC TGA 
gly OPA ser val asp OPA 
93/31 

CCG GAT GTT CAA GCA ACA 
pro asp val gin ala thr 

153/51 
CGA CGG CAA GCC CCG GCG 
arg arg gin ala pro ala 

213/71 
ACG TCA CCG GGT CTG TGG 
thr ser pro gly leu trp 

273/91 
GGG CGG CGA CCG GCA TTG 
gly arg arg pro ala leu 

333/111 
TTG GGC TCG GTA ACG TCA 
leu gly ser val thr ser 

393/131 
ACG CTC GGC AAC CAA GGA 
thr leu gly asn gin gly 

SEQ ID N° 22C 
FIGURE 22C 









31/11 




TCA 


ACA 


TCG 


CGA TCG 


GCG 


ser 


thr 


ser 


arg ser 


ala 








91/31 




CTC 


CGG 


AGG 


TGA AGT 


CCG 


leu 


arg 


arg 


OPA ser 


pro 








151/51 




CGG 


GCA 


CCG 


GAC AGG 


GTA 


arg 


ala 


pro 


asp arg 


val 








211/71 




GGT 


GAA 


GCG 


TGG ACT 


GAC 


gly 


glu 


ala 


trp thr 


asp 








271/91 




CGG 


ATG 


TTC 


AAG CAA 


CAA 


arg 


met 


phe 


lys gin 


gin 








331/111 




GAC 


GGC 


AAG 


CCC CGG 


CGC 


asp 


gly 


lys 


pro arg 


arg 








391/131 




GTC 


ACC 


GGC 


TCC GTG 


GTG 


val 


thr 


gly 


ser val 


val 








451/151 




GCG 


GCG 


ACC 


GGC ATT 


GCC 


ala 


ala 


thr 


gly ile 


ala 








511/171 




GGG 


CTC 


GGT 


AAC GTC 


AAC 


gly 


leu 


gly 


asn val 


asn 








571/191 




GCC 


TCG 


GCA 


ACC AAG 


GAC 


ala 


ser 


ala 


thr lys 


asp 



SEQ ID N° 23A 



CGG 
arg 


TCG 
ser 


CGG 
arg 


TAG 
AMB 


CCG 
pro 


GAG 
glu 


CCG 
pro 


AGT 
ser 


CGA 
arg 


CTA 
leu 


CAG 
gin 


GAA 
glu 


GCG 
ala 


GTG 
val 


CCG 
pro 


CAT 
his 


CCG 
pro 


GGC 
gly 


CGA 
arg 


AGG 
arg 


TCG 
ser 


TGT 

cys 


GCA 


CAA 
gin 


CCG 
pro 


CGG 
arg 


CCG 
pro 


GCA 
axa 


CCG 
pro 


CCG 
pro 


TGC 
cys 


TCA 
ser 


CCG 
pro 


ACG 
thr 


GCA 
ala 


ACG 
thr 


GCG 
ala 


TCA 
ser 


CGC 
arg 


TGG 
trp 


GAT 
asp 


ACA 
thr 


CGG 
arg 


CAG 
gin 


CCA 
pro 


CTA 
leu 


CAA 
qln 


GAT 
asp 


C 


GGG CGG 
gly arg 


CGA 
arg 


CCG 
pro 


GCA 
ala 


TTG 
leu 


CCG 
pro 


TTG 
leu 


GGC 
gly 


TCG 
ser 


GTA 
val 


ACG 
thr 


TCA 
ser 


ACG 
thr 


ACG 
thr 


CCT 
pro 


CGG 
arg 


CAA 
gin 


CCA 
pro 


AGG 
arg 


ACG 
thr 


GGT CGC 
gly arg 


GGT 
gly 


AGC 
ser 


CGG 
arg 


AGC 
ser 


CGC 
arg 


GTC 
val 


GAC 
asp 


TAC 
tyr 


AGG 
arg 


AAG 
lys 


CGG 
arg 


TGA 
OPA 


CGC 
arg 


TCC 
ser 


GGG 
gly 


CCG 
pro 


AAG 
lys 


GTC 
val 


GTC 
val 


TGC 
cys 


ACA 
thr 


ACC 
thr 


GCG 
ala 


GCC 
ala 


GGC 
gly 


AAT 
asn 


GCC 
ala 


GTG 
val 


CTC 
leu 


ACC 
thr 


GAC 
asp 


GGC 
gly 


AAC 
asn 


GGC 
gly 


GTC 
val 


ACG 
thr 


CTG 
ieu 


GGA 
gly 


TAC 
tyr 


ACG 
Chr 


GGC 
gly 


AGC 
ser 


CAC 
his 


TAC 
tyr 


AAG 
lys 


ATC 
ile 





FEU1LLE DE REMFftftafiWf^REGLE 26) 



WO 99/09186 




PCT/FR98/01813 



89/185 



32/11 



CAC AAC 


CGC 


GGC 


CGG 


CAA TGT 


CAA 


CAT CGC GAT CGG CGG 


GGC GGC 


GAC 


CGG 


CAT 


TGC 




his asn 


arg 


gly 


arg 


gin cys 


gin his arg asp arg arg 


gly gly asp 


arg 


his 


CVS 


a rg 


62/21 












92/31 








CGT GCT 


CAC 


CGA 


CGG 


CAA CCC 


TCC 


GGA GGT GAA GTC CGT 


TGG GCT 


CGG 


TAA 


CGT 


CAA 


CGG 


arg ala 


his 


arg 


arg 


gin pro 


ser gly gly glu val arg 


trp ala 


arg 


OCH 


arg 


crln 


ara 


122/41 












152/51 






CGT CAC 


GCT 


GGG 


ATA 


CAC GTC 


GGG 


CAC CGG ACA GGG TAA 


CGC CTC 


GGC 


AAC 


CAA 


GGA 


CGG 


arg his 


ala 


gly 


ile 


his val 


gly his arg thr gly OCH 


arg leu gly 


asn 


aln 


crlv 


ara 


182/61 












212/71 








CAG CCA 


CTA 


CAA 


GAT 


CAC AGG 


GTG 


AAG CGT GGA CTG ACG 


GTC GCG 


GTA 


GCC 


GGA 


GCC 


GCC 


gin pro 


leu 


gin 


asp 


his arg 


val 


lys arg gly leu thr 


val ala 


val 


ala 


gly 


ala 


ala 


242/81 












272/91 










ATT CTG 


GTC 


GCA 


GGT 


CTT TCC 


GGA TGT TCA AGC AAC AAG 


TCG ACT 


ACA 


GGA 


AGC 


GGT 


GAG 


ile leu 


val 


ala 


gly 


leu ser 


gly cys ser ser asn lys 


ser thr 


thr 


gly 


ser 


gly 


glu 


302/101 












332/111 








ACC ACG 


ACC 


GCG 


GCA 


GGC ACG 


ACG 


GCA AGC CCC GGC GCC 


GCT CCG 


GGC 


CGA 


AGG 


TCG 


TCA 


thr thr 


thr 


ala 


ala 


gly thr 


thr 


ala ser pro gly ala 


ala pro gly 


arg 


arg 


ser 


ser 


362/121 












392/131 










TCG ACG 


GTA 


AGG 


ACC 


AGA ACG 


TCA 


CCG GCT CCG TGG TGT 


GCA CAA 


CCG 


CGG 


CCG 


GCA 


ATG 


ser thr 


val 


arg 


thr 


arg thr 


ser 


pro ala pro trp cys 


ala gin pro 


arg 


pro 


ala 


met 


422/141 












452/151 










TCA ACA 


TCG 


CGA 


TCG 


GCG GGG 


CGG 


CGA CCG GCA TTG CCG 


CCG TGC 


TCA 


CCG 


ACG 


GCA 


ACC 


ser thr 


ser 


arg 


ser 


ala gly 


arg 


arg pro ala leu pro 


pro cys 


ser 


pro 


thr 


ala 


thr 


482/161 












512/171 










CTC CGG 


AGG 


TGA 


AGT 


CCG TTG 


GGC 


TCG GTA ACG TCA ACG 


GCG TCA 


CGC 


TGG 


GAT 


ACA 


CGT 


leu arg 


arg 


OPA 


ser 


pro leu 


gly 


ser val thr ser thr 


ala ser 


arg 


trp 


asp 


thr 


arg 


542/181 












. 572/191 






CGG GCA 


CCG 


GAC 


AGG 


GTA ACG 


CCT 


CGG CAA CCA AGG ACG 


GCA GCC 


ACT 


ACA 


AGA 


TC 




arg ala 


pro 


asp 


arg 


val thr 


pro arg gin pro arg thr 


ala ala 


thr 


thr 


arg 







SEQ ID N" 23B 
FIGURE 23B 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 




PCT/FR98/01813 



90/185 



ACA ACC 


GCG 


GCC 


GGC 


AAT 


GTC AAC ATC GCG 


thr thr 


ala 


ala 


gly 


asn 


val asn ile ala 


63/21 










GTG CTC 


ACC 


GAC 


GGC 


AAC 


CCT CCG GAG GTG 


val leu 


thr 


asp 


gly 


asn 


pro pro glu val 


123/41 










GTC ACG 


CTG 


GGA 


TAC 


ACG 


TCG GGC ACC GGA 


val thr 


leu 


gly 


tyr 


thr 


ser gly thr gly 


183/61 










AGC CAC 


TAC 


AAG 


ATC 


ACA 


GGG TGA AGC GTG 


ser his 


tyr 


lys 


ile 


thr 


gly OPA ser val 


243/81 










TTC TGG 


TCG 


CAG 


GTC 


TTT 


CCG GAT GTT CAA 


phe trp 


ser 


gin 


val 


phe 


pro asp val gin 


303/101 










CCA CGA 


CCG 


CGG 


CAG 


GCA 


CGA CGG CAA GCC 


pro arg 


pro 


arg 


gin 


ala 


arg arg gin ala 


363/121 










CGA CGG 


TAA 


GGA 


CCA 


GAA 


CGT CAC CGG CTC 


arg arg 


OCH 


gly 


pro 


glu 


arg his arg leu 


423/141 










CAA CAT 


CGC 


GAT 


CGG 


CGG 


GGC GGC GAC CGG 


gin his 


arg 


asp 


arg 


arg 


gly gly asp arg 


483/161 










TCC GGA 


GGT 


GAA 


GTC 


CGT 


TGG GCT CGG TAA 


ser gly 


gly 


glu 


val 


arg 


trp ala arg OCH 


543/181 










GGG CAC 


CGG 


ACA 


GGG 


TAA 


CGC CTC GGC AAC 


gly his 


arg 


thr 


gly 


OCH 


arg leu gly asn 



33/11 
















ATC GGC GGG 


GCG 


GCG 


ACC 


GGC 


ATT 


GCC 


GCC 


ile gly gly 


ala 


ala 


thr 


gly 


ile 


ala 


ala 


93/31 














AAG TCC GTT 


GGG 


CTC 


GGT 


AAC 


GTC 


AAC 


GGC 


lys ser val 


gly leu 


gly 


ash 


val 


asn 


gly 


153/51 












CAG GGT AAC 


GCC 


TCG 


GCA 


ACC 


AAG 


GAC 


GGC 


gin gly asn 


ala 


ser 


ala 


thr 


lys 


asp 


gly 


213/71 












GAC TGA CGG 


TCG 


CGG 


TAG 


CCG 


CAG 


CCG 


CCA 


asp OPA arg 


ser 


arg 


AMB 


pro 


olu 


pro 


pro 


273/91 










GCA ACA AGT 


CGA 


CTA 


CAG 


GAA 


GCG 


GTG 


AGA 


ala thr ser 


arg 


leu 


gin 


glu 


ala 


val 


arg 


333/111 














CCG GCG CCG 


CTC 


CGG 


GCC 


GAA 


GGT 


CGT 


CAT 


pro ala pro 


leu 


arg 


ala 


glu 


gly 


arg 


his 


393/131 












CGT GGT GTG 


CAC AAC 


CGC 


GGC 


CGG 


CAA 


TGT 


arg gly val 


his 


asn 


arg 


giy 


arg 


gin 


cys 


453/151 










CAT TGC CGC 


CGT 


GCT 


CAC 


CGA 


CGG 


CAA 


CCC 


his cys arg 


arg 


ala 


his 


arg 


arg 


gin 


pro 


513/171 










CGT CAA CGG 


CGT 


CAC 


GCT 


GGG 


ATA 


CAC 


GTC 


arg gin arg 


arg 


his 


ala 


giy 


ile 


his 


val 


573/191 














CAA GGA CGG 


CAG 


CCA 


CTA 


CAA 


GAT 


C 




gin gly arg 


gin pro 


leu 


gin 


asp 







SEQ ID N° 23C 
FIGURE 23C 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 




PCT/FR9S701813 



91/185 



31/11 

CTA ACG ACA GGC AAA GGA GCA CAG GGT GAA GCG TGG ACT GAC GGT CGC GGT AGC CGG AGC 
leu thr thr gly lys gly ala gin gly glu ala trp thr asp gly arg gly ser arg ser 
61/21 91/31 

CGC CAT TCT GGT CGC AGG TCT TTC CGG ATG TTC AAG CAA CAA GTC GAC TAC AGG AAG CGG 
121/41 3 P ^ ^ 9ln Val aSp tyr arg lvs ar 9 

TGA GAC CAC GAC CGC GGC AGG CAC GAC GGC AAG CCC CGG CGC CGC TCC GGG CCG AAG GTC 
OPA asp his asp arg gly arg his asp gly lys pro arg arg arg ser gly pro lys val 
181/61 211/71 

GTC ATC GAC GGT AAG GAC CAG AAC GTC ACC GGC TCC GTG GTG TGC ACA ACC GCG GCC GGC 

o!wtn e 3SP 5 7 lyS 3SP gln asn Val thr glv ser val val cv s ^r thr ala ala gly 
241/81 271/91 

AAT GTC AAC ATC GCG ATC GGC GGG GCG GCG ACC GGC ATT GCC GCC GTG CTC ACC GAC GGC 

o^/T*! 3311 Ue ala Ue 9ly gly ala ala thr * lv ile ala ala v al leu thr asp gly 
301/101 331/111 

AAC CCT CCG GAG GTG AAG TCC GTT GGG CTC GGT A*C GTC AAC GGC GTC ACG CTG GGA TAC 

Pr ° glU Val lyS Ser Vdl gly leu gly asn vai asn 9 lv val thr leu gly tyr 

361/121 391/131 

ACG TCG GGC ACC GGA CAG GGT AAC GCC TCG GCA ACC AAG GAC GGC AGC CAC TAC AAG ATC 

thr ser gly thr gly gln gly asn ala ser ala thr lys asp gly se r his tyr lys ile 



SEQ ID N° 24A 
FIGURE 24A 



TAA CGA CAG GCA AAG GAG CAC AGG GTG AAG 
OCH arg gln ala lys glu his arg val lys 
62/21 

GCC ATT CTG GTC GCA GGT CTT TCC GGA TGT 
ala ile leu val ala gly leu ser gly cys 
122/41 

GAG ACC ACG ACC GCG GCA GGC ACG ACG GCA 
glu thr thr thr ala ala gly thr thr ala 
182/61 

TCA TCG ACG GTA AGG ACC AGA ACG TCA CCG 
ser ser thr val arg thr arg thr ser pro 
242/81 

ATG TCA ACA TCG CGA TCG GCG GGG CGG CGA 
met ser thr ser arg ser ala gly arg arg 
302/101 

ACC CTC CGG AGG TGA AGT CCG TTG GGC TCG 
thr leu arg arg OPA ser pro leu gly ser 
362/121 

CGT CGG GCA CCG GAC AGG GTA ACG CCT CGG 
arg arg ala pro asp arg val thr pro arg 



32/n 














CGT GGA 


CTG 


ACG 


GTC 


GCG 


GTA 


GCC GGA GCC 


arg giy 


leu 


thr 


val 


ala 


val 


ala gly ala 


92/31 












TCA AGC 


AAC 


AAG 


TCG 


ACT 


ACA 


GGA AGC GGT 


ser ser 


asn 


lys 


ser 


thr 


thr 


qly ser gly 


152/51 












AGC CCC 


GGC 


GCC 


GCT 


CCG 


GGC 


CGA AGG TCG 


ser pro 


gly 


ala 


ala 


pro 


gly 


arg arg ser 


212/71 












GCT CCG 


TGG 


TGT 


GCA 


CAA 


CCG 


CGG CCG GCA 


ala pro 


trp 


cys 


ala 


gln 


pro 


arg pro ala 


272/91 












CCG GCA 


TTG 


CCG 


CCG 


TGC 


TCA 


CCG ACG GCA 


pro ala 


leu 


pro 


pro 


cys 


ser 


pro thr ala 


332/111 










GTA ACG 


TCA 


ACG 


GCG 


TCA 


CGC 


TGG GAT ACA 


val thr 


ser 


thr 


ala 


ser 


arg 


trp asp thr 


392/131 










CAA CCA 


AGG 


ACG 


GCA 


GCC 


ACT 


ACA AGA TC 


gln pro 


arg 


thr 


ala 


ala 


thr 


thr arg 



SEQ ID N° 24B 



FIGURE 24B 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 




PCT/FR98/01813 



92/185 



33/11 



AAC GAC 


AGG 


CAA AGG 


AGC 


ACA GGG TGA AGC GTG GAC TGA 


CGG 






iAb 




GAG 


CCG 


asn asp 
63/21 


arg 


gin arg 


ser 


thr gly OPA ser val asp OPA 
93/31 


arg 


ser 


arg 


AMD 


pro 


glu 


pro 


CCA TTC 


TGG 


TCG CAG 


GTC 


TTT CCG GAT GTT CAA GCA ACA AGT 










GCG 


GTG 


pro phe 


trp 


ser gin 


val 


phe pro asp val gin ala thr 


ser 


arg 


leu 


gin 


glu 


ala 


val 


123/41 








153/51 










AGA CCA 


CGA 


CCG CGG 


CAG 


GCA CGA CGG CAA GCC CCG GCG 


CCG 


CTC 


CGG 


GCC 


GAA 


GGT 


CGT 


arg pro 
183/61 


arg 


pro arg 


gin 


ala arg arg gin ala pro ala 
213/71 


pro 


leu 


arg 


ala 


glu 


gly 


arg 


CAT CGA 


CGG 


TAA GGA 


CCA 


GAA CGT CAC CGG CTC CGT GGT 


GTG 


CAC 


AAC 


CGC 


GGC 


CGG 


CAA 


his arg 
243/81 


arg 


OCH gly 


pro 


glu arg his arg leu arg gly val 
273/91 


his 


asn 


arg 


gly 


arg 


gin 


TGT CAA 


CAT 


CGC GAT 


CGG 


CGG GGC GGC GAC CGG CAT TGC 


CGC 


CGT 


GCT 


CAC 


CGA 


CGG 


CAA 


cys gin 
303/101 


his 


arg asp 


arg 


arg gly qly asp arg his cys 
333/111 


arg 


arg 


ala 


his 


arg 


arg 


gin 


CCC TCC 


GGA 


GGT GAA 


GTC 


CGT TGG GCT CGG TAA CGT CAA 


CGG 


CGT 


CAC 


GCT 


GGG 


ATA 


CAC 


pro ser 


gly 


gly glu 


val 


arg trp ala arg OCH arg gin 


arg 


arg 


his 


ala 


gly 


ile 


his 


363/121 








393/131 








GTC GGG 


CAC 


CGG ACA 


GGG 


TAA CGC CTC GGC AAC CAA GGA 


CGG 


CAG 


CCA 


CTA 


CAA 


GAT 


C 


val gly 


his 


arg thr 


gly 


OCH arg leu gly asn gin gly 


arg 


gin 


pro 


leu 


gin 


asp 





SEQ ID N° 24C 
FIGURE 24C 

Amorce clirecte 
5* ACG CGG CGC AGC CTG TTG 3' 

SEQ ID N° 25 
FIGURE 25 

Amorce inverse 
5' CGA CCT TGG GAT TCG CCT 3' 

SEQ ID N° 26 
FIGURE 26 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 




PCT/FR98/01813 



93/185 



CCT ACC AGC AAG AGC 
pro thr ser lys set 
61/21 

TCC AAT TTT CCT TCC 
ser asn phe pro ser 
121/41 

CGG TCG CGC AGC TTG 
arg ser arg ser leu 
181/61 

GTC GTC GCT CTC CAC 
val val ala leu his 
241/81 

TCG GCT GAG TGT CTG 
ser ala glu cys leu 
301/101 

AAG TCC CCC CCG CGC 
lys ser pro pro arg 
361/121 

CTC ATT TCG CAG CAA 
leu ile ser gin gin 
421/141 

GTC GGA CGA GTC GTC 
val gly arg val val 



CCA GGG CTT CAC AGG 
pro gly leu his arg 

GCC CCG TGC AAT ACC 
ala pro cys asn thr 

CGG AAA CGG GGT ATG 
arg lys arg gly met 

CCG TCG GGG GGC GAA 
pro ser gly gly glu 

CAG GGC TCC GGG GAG 
gin gly ser gly glu 

GAC TTC CAG ACA TTT 
asp phe gin thr phe 

GCG GTC TCC GGG TCG 
ala val ser gly ser 

GTC AAC GAC CAC GAT 
val asn asp his asp 



31/11 

ACC TAA AAG GAG TAG 
thr OCH lys glu AMB 
91/31 

ATC TGC AAG ACC AGC 
ile cys lys thr ser 
151/51 

GAC CCT GCC GTA CCG 
asp pro ala val pro 
211/71 

AGC CAT TCC GAC ACT 
ser his ser asp thr 
271/91 

CAG CCG ATC ATC ACC 
gin pro ile ile thr 
331/111 

GTT GTG GTT TCG GTT 
val val val ser val 
391/131 

CAG CAT CGT TGC GGC 
gin his arg cys gly 

C 



CGC CCA TGG GCT TGA 
arg pro trp ala OPA 

GAC GGC CCG TGG TTG 
asp gly pro trp leu 

TTG TTG CCA CTT GAT 
leu leu pro leu asp 

GGG ATC CTC AAA ACG 
gly ile leu lys thr 

ATG TAC GAA CTG AAT 
met tyr glu leu asn 

GAG GCC GAG GCG AGG 
glu ala glu ala arg 

GAT CGC GGC GCA GTC 
asp arg gly ala val 



SEQ ID N° 27A 
FIGURE 27A 



31/11 

CTA CCA GCA AGA GCC CAG GGC TTC ACA GGA CCT AAA AGG AGT AGC GCC CAT GGG CTT GAT 

leu pro ala arg ala gin gly phe thr gly pro lys arg ser ser ala his gly leu asp 

61/21 91/31 * f 

CCA ATT TTC CTT CCG CCC CGT GCA ATA CCA TCT GCA AGA CCA GCG ACG GCC CGT GGT TGC 
pro xle phe leu pro pro arg ala ile pro ser ala arg pro ala thr ala arg gly cys 
121/41 151/51 

GGT CGC GCA GCT TGC GGA AAC GGG GTA TGG ACC CTG CCG TAC CGT TGT TGC CAC TTG ATG 

?iw« 9 ° yS gly aSn gly Val trp thr leu pro ar * cvs his .leu met 

181/61 211/71 

TCG TCG CTC TCC ACC CGT CGG GGG GCG AAA GCC ATT CCG ACA CTG GGA TCC TCA AAA CGT 

o!w«? r S " ar9 gly aia lyS ala ile pro thr leu *ly ser lys arg 

241/81 271/91 

CGG CTG AGT GTC TGC AGG GCT CCG GGG AGC AGC CGA TCA TCA CCA TGT ACG AAC TGA ATA 

SJn ^ arg Pr ° gly Set Ser arg Ser ser ? ro ^ thr *™ ile 
301/101 331/111 

AGT CCC CCC CGC GCG ACT TCC AGA CAT TTG TTG TGG TTT CGG TTG AGG CCG AGG CGA GGC 

pr ° arg aia thr ser arg his leu leu trp phe ar * leu ar * p™ «9 «g giy 

361/121 391/131 

TCA TTT CGC AGC AAG CGG TCT CCG GGT CGC AGC ATC GTT GCG GCG ATC GCG GCG CAG TCG 

421/141 gly arg Ue Val aU 313 Ue ala ala * ln ser 

TCG GAC GAG TCG TCG TCA ACG ACC ACG ATC 
ser asp glu ser ser ser thr thr thr ile 



SEQ ID N° 27B 



FEUILLE DE REM^g^E^yREGLE 26) 



WO 99/09186 



PCT/FR98/01813 



94/185 
33/11 

TAG GAG CAA GAG CCC AGG GCT TCA CAG GAC CTA AAA GGA GTA GCG CCC ATG GGC TTG ATC 
tyr gin gin glu pro arg ala ser gin asp leu lys gly val ala pro met gly leu ile 
63/21 93/31 

CAA TTT TCC TTC CGC CCC GTG CAA TAC CAT CTG CAA GAC CAG CGA CGG CCC GTG GTT GCG 
gin phe ser phe arg pro val gin tyr his leu gin asp gin arg arg pro val val ala 
123/41 153/51 

GTC GCG CAG CTT GCG GAA ACG GGG TAT GGA CCC TGC CGT ACC GTT GTT GCC ACT TGA TGT 
val ala gin leu ala glu thr gly tyr gly pro cys arg thr val val ala thr OPA cys 
183/61 213/71 

CGT CGC TCT CCA CCC GTC GGG GGG CGA AAG CCA TTC CGA CAC TGG GAT CCT CAA AAC GTC 
arg arg ser pro pro val gly gly arg lys pro phe arg his trp asp pro gin asn val 
243/81 273/91 

GGC TGA GTG TCT GCA GGG CTC CGG GGA GCA GCC GAT CAT CAC CAT GTA CGA ACT GAA TAA 
gly OPA val ser ala gly leu arg gly ala ala asp his his his val arg thr glu OCH 
303/101 333/111 

GTC CCC CCC GCG CGA CTT CCA GAC ATT TGT TGT GGT TTC GGT TGA GGC CGA GGC GAG GCT 
val pro pro ala arg leu pro asp ile cys cys gly phe gly OPA gly arg gly glu ala 
363/121 393/131 

CAT TTC GCA GCA AGC GGT CTC CGG GTC GCA GCA TCG TTG CGG CGA TCG CGG CGC AGT CGT 
his phe ala ala ser gly leu arg val ala ala ser leu arg arg ser arg arg ser arq 
423/141 

CGG ACG AGT CGT CGT CAA CGA CCA CGA TC 
arg thr ser arg arg gin arg pro arg 

SEQ ID N* 27C 
FIGURE 27C 



MKTGTATT RRRLIAVL I ALALPGAAVAL LAEPS ATGAS D PCAAS EVAR 
TVGS VAKSMGDYLDSH PETNQVMTAVLQQQVGP GS VAS LKAH FEAN PK 
VASDLHALSQPLTDLSTRCSLP1SGLQAIGLMQAVQGARR 



SEQ ID N Q 28 
FIGURE 28 



GTGGGCAAGC AGCTAGCCGC GCTCGCCGCG CTGGTCGGTG CGTGCATGCT CGCAGCCGGA 60 

TGCACCAACG TGGTCGACGG GACCGCCGTG GCTGCCGACA AATCCGGACC ACTGCATCAG 120 

GATCCGATAC CGGTTTCAGC GCTTGAAGGG CTGCTTCTCG ACTTGAGCCA GATCAATGCC 180 

GCGCTGGGTG CGACATCGAT GAAGGTGTGG TTCAACGCCA AGGCAATGTG GGACTGGAGC 240 

AAGAGCGTGG CCGACAAGAA TTGCCTGGCT ATCGACGGTC CAGCACAGGA AAAGGTCTAT 300 

GCCGGCACCG GGTGGACCGC TATGCGCGGC CAACGGCTGG ATGACAGCAT CGATGACTCC 360 

AAGAAACGCG ACCACTACGC CATTCAAGCG GTCGTCGGCT TCCCGACCGC ACATGATGCC 420 

GAGGAGTTCT ACAGCTCCTC GGTGCAAAGC TGGAGCAGCT GCTCGAACCG CCGGTTTGTC 480 

GAAGTCACCC CCGGACAGGA CGACGCCGCC TGGACTGTGG CTGACGTTGT CAACGACAAC 540 

GGCATGCTCA GTAGCTCGCA GGTTCAGGAA GGCGGCGACG GATGGACCTG CCAGCGTGCC 600 

CTGACTGCGC GCAACAACGT CACTATCGAC ATTGTCACGT GCGCCTATAG CCAACCGGAT 660 

TTGGTGGCGA TTGGCATCGC TAACCAAATC GCGGCCAAGG TTGCTAAGCA GTAG 714 



SEQ ID N° 29 
FEUILLE DE REMPO©BMEKB(REGLE 26) 



WO 99/09186 ^^PCI7FR98/01813 

95/185 



MGKQLAALAALVGACMLAAGCTNVVDGTAVAADKSGPLKQDPIPVFTSALEGLLLDLSQI 
MKVWFNAKAMWDWSKSVADKNCLAI DGPAQEKVYAGTGFTWTAMRGQRLDDS I DDS KKRDH YAI OAW 

GFPTAHDAEEFYSSSVQSWSSCSNRRFVEWFTPGQDDAAWTVADVVNDNGMLSSSQVQEGGDGOT 
RALTARNNVTIDIVTCAYSQPDLVFTAIGIANQIAAKVAKQ ^ ^ 



SEQ ID N° 30 
FIGURE 30 

l ' 1 31/11 
AGG CGA ATA CCC GCG AGG GCA GCG CGA CGG CGG CCC 
arg arg ile pro ala arg ala ala arg arg arg pre 
61/21 91/31 
ACA CAT CCC AGC CGC GCA CGC TTC CGG TAT GCG GC; 
thr his pro ser arg ala arg phe arg tyr ala ale 
121 '«1 151/51 
ACA CCA GGA TTG CGA CAA CCA AAG CCC TCG CGC CTC 
thr pro gly leu arg gin pro lys pro ser arg lei 
181/61 211/71 



TGC 


CGG 


CGC 


CGT 


GGC 


TGC 


TGA ACA 


cys 


arg 


arg 


arg 


gly 


cys 


OPA thr 


GGA 


TAA 


ACG 


ACC 


CCA 


ACA 


GCA CGA 


gly 


OCH 


thr 


thr 


pro 


thr 


ala arg 


GCT 


CGA 


TTT 


CGC 


GCG 


CAA 


CGC GGC 


ala 


arg 


phe 


arg 


ala 


gin 


arg gly 


GAT 


C 












asp 















SEQ ID N° 31A 



FIGURE 31A 



1/1 

GGC GAA TAC CCG 
gly glu tyr pro 
61/21 

CAC ATC CCA GCC 
his ile pro ala 
121/41 

CAC CAG GAT TGC 
his gin asp cys 
181/61 

TTC TGC CGC CTC 
phe cys arg leu 



CGA GGG CAG CGC 
arg gly gin arg 

GCG CAC GCT TCC 
ala his ala ser 

GAC AAC CAA AGC 
asp asn gin ser 

GAT CTC AGC GCG 
asp leu ser ala 



31/11 
GAC GGC GGC CCT 
asp gly gly pro 

91/31 
GGT ATG CGG CAG 
gly met arg gin 

151/51 
CCT CGC GCC TGG 
pro arg ala trp 

211/71 
GAG GGC GTC GAG 
glu gly val glu 



GCC 


GGC 


GCC 


GTG 


ala 


gly 


ala 


val 


GAT 


AAA 


CGA 


CCC 


asp 


lys 


arg 


pro 


CTC 


GAT 


TTC 


GCG 


leu 


asp 


phe 


ala 



ATC 
ile 



GCT 


GCT 


GAA 


CAA 


ala 


ala 


glu gin 


CAA 


CAG 


CAC 


GAA 


gin 


gin 


his 


glu 


CGC 


AAC 


GCG 


GCG 


arg 


asn 


ala 


ala 



SEQ ID N° 31B 



FIGURE 31B 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



1/1 








GCG AAT ACC 


CGC GAG 


GGC 


AGC 


ala aan thr 


arg glu 


gly 


ser 


61/21 






ACA TCC CAG 


CCG CGC 


ACG 


CTT 


thr ser gin 


pro arg 


thr 


leu 


121/41 






ACC AGG ATT 


GCG ACA 


ACC 


AAA 


thr arg ile 


ala thr 


thr 


lys 


181/61 






TCT GCC GCC 


TCG ATC 


TCA 


GCG 


ser ala ala 


ser ile 


ser 


ala 



96/185 





31/11 




GCG 


ACG GCG GCC CTG 


CCG 


ala 


thr ala ala leu 


pro 




91/31 


CCG 


GTA TGC GGC AGG 


ATA 


pro 


val cys gly arg 


ile 




151/51 




GCC 


CTC GCG CCT GGC 


TCG 


ala 


leu ala pro gly 


ser 




211/71 




CGG 


AGG GCG TCG AGA 


TC 


arg 


arg ala ser arg 





GCG 


CCG TGG CTG 


CTG 


AAC 


AAC 


ala 


pro trp leu 


leu 


asn 


asn 


AAC 


GAC CCC AAC 


AGC 


ACG 


AAC 


asn 


asp pro asn 


ser 


thr 


asn 


ATT 


TCG CGC GCA 


ACG 


CGG 


CGT 


ile 


ser arg ala 


thr 


arg 


arg 



SEQ ID N° 31C 



FIGURE 31C 



orf d'apres 


Cole et 


al. 


1/1 










taa acg 


acc 


cca 


aca 


gca 


OCH thr 


thr 


pro 


thr 


ala 


61/21 








cga ttt 


cgc 


gcg 


caa 


cgc 


arg phe 


arg 


ala 


gin 


arg 


121/41 










ccc egg 


cgt 


cgt 


gtt 


cgt 


pro arg 


arg 


arg 


val 


arg 


181/61 










cag ccc 


gac 


ccc 


agg 


cat 


gin pro 


asp 


pro 


arg 


his 


241/81 










gtc gec 


ggc 


gcg 


ggt 


gcg 


val ala 


gly 


ala 


gly 


ala 


301/101 










cgc cgc 


ttc 


ggt 


gac 


ctt 


arg arg 


phe 


gly 


asp 


leu 


361/121 










ggt gaa 


gtg 


cac 


cag 


gcg 


gly glu 


val 


his 


gin 


ala 


421/141 








ctt gcg 


ccc 


ttc 


ccc 


ggt 


leu ala 


pro 


phe 


pro 


gly 


481/161 








ggc ttc 


cag 


cga 


gat 


ttg 


gly phe 


gin 


arg 


asp 


leu 


541/181 










ggc ttt 


egg 


cag 


ctg 


tec 


gly phe 


arg 


gin 


leu 


ser 


601/201 










gaa ggt 


aaa 


tgc 


ggc 


cgc 


glu gly 


lys 


cys 


gly 


arg 


661/221 










etc ttc 


ggt 


etc 


ccc 


ggg 


leu phe 


gly 


leu 


pro 


gly 


721/241 










ggc cgc 


ccg 


cac 


gcg 


etc 


gly arg 


pro 


his 


ala 


leu 


781/261 










cgc gcg 


cag 


gat 


ccg 


gtc 


arg ala 


gin 


asp 


pro 


val 



(Nature 


393:537- 


•544) et con 










31/11 


cga 


aca 


cea 


gga 


ttg cga caa 


arg 


thr 


pro 


giy 


leu arg gin 










91/31 


ggc 


gtt 


ctg 


ccg 


cct cga tct 


gly 


val 


leu 


pro 


pro arg ser 










151/51 


ggc 


tea 


tea 


tct 


gca tec tec 


gly 


ser 


ser 


ser 


ala ser ser 










211/71 


gec 


cag 


gec 


gac 


ggc gcg ccc 


ala 


gin 


ala 


asp 


gly ala pro 










271/91 


gcg 


gtg 


ggt 


cag 


gac gec ggc 


ala 


val 


gly 


gin 


asp ala gly 










331/111 


cgt 


ggt 


gat 


gac 


gtc gec ggg 


arg 


gly 


asp 


asp 


val ala gly 










391/131 


ccc 


gtc 


gcg 


cgc 


ccg ccc get 


pro 


val 


ala 


arg 


pro pro ala 










451/151 


ggc 


cac 


cag 


cac 


etc gac ggc 


gly 


his 


gin 


his 


leu asp gly 










511/171 


etc 


ctg 


cag 


cgc 


gat cag gcg 


leu 


leu 


gin 


arg 


asp gin ala 










571/191 


gtc 


gag 


ttg 


cgc 


ggc egg tgt 


val 


glu 


leu 


arg 


gly arg cys 










631/211 


gaa 


gcg 


ggc 


ccg 


gcg cac cac 


glu 


ala 


gly 


pro 


ala his his 










691/231 


gaa 


acc 


gac 


gat 


cag ate ggc 


glu 


thr 


asp 


asp 


gin ile gly 










751/251 


gat 


gat 


gec 


gag 


gta gcg etc 


asp 


asp 


ala 


glu 


val ala leu 










811/271 


gga 


tec 


gga 


ctg 


tag 


gly 


ser 


gly 


leu 


AMB 



seq3lA 



cca 
pro 


aag 
lys 


ccc 
pro 


teg 
ser 


cgc 
arg 


ctg 
leu 


get 
ala 


cag 
gin 


cgc 
arg 


gga 
gly 


ggg 

gly 


cgt 
arg 


cga 
arg 


gat 
asp 


ggg 

gly 


ctt 
leu 


ggc 
gly 


cgc 
arg 


get 
ala 


gac 
asp 


egg 
arg 


egg 
arg 


ctg 
leu 


ccc 
pro 


ggc 
gly 


ggt 
gly 


gtg 
val 


cgc 
arg 


gtc 
val 


ggc 
gly 


gat 
asp 


gag 
glu 


gtg 
val 


gtg 
val 


egg 
arg 


acg 
thr 


cac 
his 


gcg 
ala 


egg 
arg 


ctg 
leu 


gee 
ala 


ggc 
gly 


cat 
hi 3 


gcg 
ala 


cgc 
arg 


cgt 
arg 


gac 
asp 


ggt 
gly 


gtc 
val 


ctg 
leu 


ccc 
pro 


gac 
asp 


cag 
gin 


ggc 
gly 


gcg 
ala 


gtt 
val 


ttc 
phe 


ata 
ile 


gcg 
ala 


ttc 
phe 


ctg 
leu 


cac 
his 


aac 
asn 


ccc 
pro 


ggg 
giy 


ccg 
pro 


ctt 
leu 


gga 
gly 


gta 
val 


ttg 
leu 


gtc 
val 


gag 
glu 


cgt 
arg 


ggc 
gly 


cgc 
arg 


gaa 
glu 


gtc 
val 


ggt 
gly 


aat 
asn 


cgc 
arg 


ggc 
gly 


atg 
met 


egg 
arg 


gat 
asp 


ggc 
gly 


acg 
thr 


ata 
ile 


gga 
gly 


ccg 
pro 


ccg 
pro 


cat 
his 



SEQ ID N° 31F 



FEUILLE DE REMPE£BEMEH|F(REGLE 26) 



WO 99/09186 




CT/FR98/01813 



97/185 



1/1 

aga ctg gtg tac acg 
arg leu val tyr thr 
61/21 

eta gtg aag gtc att 
leu val lys val ile 
121/41 

ttc gtc ggt ttc gcg 
phe val gly phe ala 
181/61 

ccg ttg egg gac tac 
pro leu arg asp tyr 
241/81 

ggg ccg acc gcg ctg 
gly pro thr ala leu 
301/101 

tac ggg cgc ate aaa 
tyr gly arg ile lys 



gag acc aag ctg aac 
glu thr lys leu asn 

cag aaa ctg teg ggc 
gin lys leu ser gly 

egg atg gtc gag gee 
arg met val glu ala 

gaa ctg ggc acg gtg 
glu leu gly thr val 

aac tat gtg cgc get 
asn tyr val arg ala 

cgc cag cag ttg ttt 
arg gin gin leu phe 



31/11 

teg gca ttc tec ttc 
ser ala phe ser phe 
91/31 

ttg age ate aac egg 
leu ser ile asn arg 
151/51 

etc ggc ggc gtc gag 
leu gly gly val glu 
211/71 

ctg gag cac gee gga 
leu glu his ala gly 
271/91 

cgc cag gtc acc acc 
arg gin val thr thr 
331/111 

ttg teg teg ctg ctg 
leu ser ser leu leu 



ggg cct aag tgt 
gly gly pro lys cys 

ttc ate gcg att gac 
phe ile ala ile asp 

gta tgc age acc acc 
val cys ser thr thr 

cgc cag gtc att gac 
arg gin val ile asp 

gag age aat ggc gac 
glu ser asn gly asp 

cgt teg atg ate 
arg ser met ile 



SEQ ID N° 32A 
FIGURE 32A 



1/1 

gac tgg tgt aca egg 
asp trp cys thr arg 
61/21 

tag tga agg tea ttc 
AMB OPA arg ser phe 
121/41 

teg teg gtt teg cgc 
ser ser val ser arg 
181/61 

cgt tgc ggg act acg 
arg cys gly thr thr 
241/81 

ggc cga ccg cgc tga 
gly arg pro arg OPA 
301/101 

acg ggc gca tea aac 
thr gly ala ser asn 



aga cca age tga act 
arg pro ser OPA thr 

aga aac tgt egg get 
arg asn cys arg ala 

gga tgg teg agg ccc 
gly trp ser arg pro 

aac tgg gca egg tgc 
asn trp ala arg cys 

act atg tgc gcg etc 
thr met cys ala leu 

gee age agt tgt ttt 
ala ser ser cys phe 



31/11 

egg cat tct cct teg 
arg his ser pro ser 
91/31 

tga gca tea acc ggt 
OPA ala ser thr gly 
151/51 

teg gcg gcg teg agg 
ser ala ala ser arg 
211/71 

tgg age acg ccg gac 
trp ser thr pro asp 
271/91 

gee agg tea cca ccg 
ala arg ser pro pro 
331/111 

tgt cgt cgc tgc tgc 
cys arg arg cys cys 



gcg ggc eta agt gtc 
ala gly leu ser val 

tea teg cga ttg act 
ser ser arg leu thr 

tat gca gca cca ccc 
tyr ala ala pro pro 

gec agg tea ttg acg 
ala arg ser leu thr 

aga gca atg gcg act 
arg ala met ala thr 

gtt cga tga tc 
val arg OPA 



SEQ ID N° 32B 
FIGURE 32B 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 




PCT7FR98/01813 



98/185 



1/1 












31/11 












act ggt 
thr gly 
61/21 


gta 
val 


cac 
his 


gga 
gly 


gac 
asp 


caa get 
gin ala 


gaa etc ggc att 
glu leu gly ile 
91/31 


etc 
leu 


ctt egg egg gcc 
leu arg arg ala 


taa 
OCH 


gtg 
val 


tct 
ser 


agt gaa 
ser glu 
121/41 


ggt 
gly 


cat 
his 


tea 
ser 


gaa 
glu 


act gtc 
thr val 


ggg ctt gag cat 
gly leu glu his 
151/51 


caa 
gin 


ccg gtt cat cgc 
pro val his arg 


gat 
asp 


tga 
OPA 


ctt 
leu 


cgt egg 
arg arg 
181/61 


ttt 
phe 


cgc 
arg 


gcg 
ala 


gat 
asp 


ggt cga 
gly arg 


ggc cct egg egg 
gly pro arg arg 
211/71 


cgt 
arg 


cga ggt atg cag 
arg gly met gin 


cac 
his 


cac 
his 


ccc 
pro 


gtt gcg 
val ala 
241/81 


gga 
gly 


eta 
leu 


cga 
arg 


act 
thr 


ggg cac 
gly his 


ggt get gga gca 
gly ala gly ala 
271/91 


cgc 
arg 


egg acg cca ggt 
arg thr pro gly 


cat 
his 


tga 
OPA 


egg 
arg 


gcc gac 
ala asp 
301/101 


cgc 
arg 


get 
ala 


gaa 
glu 


eta 
leu 


tgt gcg 
cys ala 


cgc teg cca ggt 
arg ser pro gly 
331/111 


cac 
his 


cac cga gag caa 
his arg glu gin 


tgg 
trp 


cga 
arg 


eta 
leu 


egg gcg 
arg ala 


cat 
hi 9 


caa 
gin 


acg 
thr 


cca 
pro 


gca gtt 
ala val 


gtt ttt gtc gtc 
val phe val val 


get 
ala 


get gcg ttc gat 
ala ala phe asp 


gat 
asp 


c 





SEQ ID N° 32C 
FIGURE 32C 



sequence Rv0822c predite par Cole et al. (Nature 393:537-544) et contenant seq 32A 



1/1 


















31/11 


















atg agt 
Met ser 
61/21 


gac 
asp 


ggc 
gly 


gag 
glu 


age 
ser 


gcc 
ala 


gcg 

ala 


ccg 
pro 


tgg 
trp 


gca egg 
ala arg 
91/31 


etc 
leu 


tec 
ser 


gag 
glu 


tea 
ser 


gca 
ala 


ttc 
phe 


ccc 
pro 


gat 
asp 


ggt gtt 
gly val 
121/41 


gac 
asp 


cga 
arg 


tgg 

trp 


ate 
ile 


acg 
thr 


gta 
val 


ccg 
pro 


ccc 
pro 


gcc aca 
ala thr 
151/51 


tgg 
trp 


gtg 
val 


gca 
ala 


gcc 
ala 


cag 
gin 


ggt 

giy 


ccg 
pro 


egg 
arg 


gac ace 
asp thr 
181/61 


cag 
gin 


aat 
asn 


gtc 
val 


ggc 
gly 


tgt 
cys 


cat 
his 


gcc 
ala 


ace 
thr 


ggc gcc 
gly ala 
211/71 


gtt 

val 


agt 
ser 


gtg 
val 


gcc 
ala 


gat 
asp 


ctg 
leu 


ate 
ile 


gcc 
ala 


agg etc 
arg leu 
241/81 


ggc 
gly 


ccc 
pro 


get 
ala 


ttt 
phe 


cct 
pro 


gac 
asp 


etc 
leu 


ccc 
pro 


acg cac 
thr his 
271/91 


cgc 
arg 


cat 
his 


gtc 
val 


gcc 
ala 


ccc 
pro 


gaa 
glu 


ccc 
pro 


gag 
glu 


cca tec 
pro ser 
301/101 


ggc 
gly 


cgc 
arg 


ggc 
gly 


ccg 
pro 


aag 
lys 


gtc 
val 


cac 
his 


gac 
asp 


gac gcc 
asp ala 
331/111 


gac 
asp 


gac 
asp 


cag 
gin 


cag 
gin 


gac 
asp 


acc 
thr 


gag 
glu 


get 
ala 


ate gcc 
ile ala 
361/121 


ate 
ile 


ccg 
pro 


gcc 
ala 


cac 
his 


teg 
ser 


etc 
leu 


gag 
glu 


ttc 
phe 


etc teg 
leu ser 
391/131 


gag 
glu 


ctt 
leu 


ccc 
pro 


gac 
asp 


etc 
leu 


egg 
arg 


gca 
ala 


gcc 
ala 


aac tat 
asn tyr 
421/141 


ccg 
pro 


cgc 
arg 


gcc 
ala 


gac 
asp 


cac 
his 


gcc 
ala 


cgc 
arg 


cgt 
arg 


gaa ccc 
glu pro 
451/151 


gag 
glu 


eta 
leu 


ccc 
pro 


ggc 
giy 


aag 
lys 


cag 
gin 


eta 
leu 


acc 
thr 


gga teg 
gly ser 
481/161 


get 
ala 


cga 
arg 


gtg 

val 


egg 
arg 


cca 
pro 


ttg 
leu 


egg 
arg 


ate 
ile 


cgc cga 
arg arg 
511/171 


acg 
thr 


teg 
ser 


ccc 
pro 


gcg 
ala 


ccc 
pro 


gcc 
ala 


aag 
lys 


cca 
pro 


gcg ccg 
ala pro 
541/181 


aac 
asn 


tec 
ser 


ggc 
gly 


egg 
arg 


cgc 
arg 


ccg 
pro 


atg 
met 


gtg 

val 


ctg gcc 
leu ala 
571/191 


gcg 
aia 


cgc 
arg 


teg 
ser 


ctg 
leu 


gcg 
ala 


get 
ala 


ctg 
leu 


ttt 
phe 


gcc get 
ala ala 
601/201 


ctg 
leu 


gcg 
ala 


ttg 
leu 


gcg 
ala 


ctg 
leu 


ace 
thr 


ggc 
gly 


ggg 

gly 


gca tgg 
ala trp 
631/211 


cag 
gin 


tgg 
trp 


age 
ser 


gcg 
ala 


teg 
ser 


aag 

iya 


aac 
asn 


age 
ser 


egg ctg 
arg leu 


aac 
asn 


atg 
met 


gta 
val 


age 
ser 


gcg 
ala 


etc 
leu 


gac 
asp 


ccg 
pro 


cat teg 
his ser 


ggc 
gly 


gac 
asp 


ate 
ile 


gtc 
val 


aac 
asn 


ccc 
pro 


age 
ser 


ggg 

gly 



SEQ ID N° 32D 



FEUILLE DE REMfiEflB§filEtfW[REGLE 26) 



WO 99/09186 ^PPCT/FR98/01813 



99/185 



661/221 






cag cat ggc 


gac 


gag 


gin his gly 


asp 


glu 


"721/241 






aat ate ggc 


gcc 


ggc 


asn ile gly 


ala 


gly 


781/261 






gtc aac att 


ccg 


gcc 


val asn ile 


pro 


ala 


841/281 






ate act cca 


ate 


caa 


ile thr pro 


ile 


gin 


901/301 






aac gag aag 


aca 


gga 


asp glu lvs 


thr 




961/321 






cca ttc tec 


ttc 


ggc 


ala phe ser 


phe 


olv 


1021/341 






age ate aac 


caa 


ttc 


ser ile asn 


arg 


phe 


1081/361 






ggc ggc gtc 


crag 


eta 


gly gly val 


glu 


val 


1141/381 






gag cac gcc 


gga 


cgc 


glu his ala 


gly 


arg 


1201/401 




cag gtc ace 


acc 


era a 


gin val thr 


thr 


glu 


1261/421 




teg teg ctg 


etc 


cat 


ser ser leu 


leu 


arg 


1321/441 




aac gtc gtc 


aac 


atg 


asn val val 


asn 


met 


1381/461 






gtc gaa etc 


ggt 


caa 


val glu leu 


gly 


arg 


1441/481 






ccg ace ggt 


ata 


acc 


pro thr gly 


ile 


thr 


1501/501 






ctt ttc acc 


gcc 


ate 


leu phe thr 


ala 


ile 


1561/521 






cgt ctg ggc 


aac 


aca 


arg leu gly 


asn 


thr 


1621/541 






ctg acc aac 


gag 


att 


leu thr asn 


glu 


ile 


1681/561 




cag gtc tct 


aac 


teg 


gin val ser 


asn 


ser 


1741/581 






egg aac ggc 


ttc 


aac 


arg asn gly 


phe 


asn 


1801/601 






gtg ttt ttt 


teg 


ccc 


val phe phe 


ser 


pro 


1861/621 






tea aag ate 


gag 


egg 


ser lys ile 


glu 


arg 



aac 
asn 


ttc 
phe 


ttg etc gtc 
leu leu val 


gac 
asp 


gcc 
ala 


gag gac gcc 
glu asp ala 


age 
ser 


cgc 
arg 


gag egg gtc 
glu arg val 


tgc 
cys 


gag 

glu 


gcg tgg aac 
ala trp asn 


a eg 
thr 


atg 
met 


ggt ccc aga 
gly pro arg 


ggg 

gly 


cct 
pro 


aag tgt eta 
lys cys leu 


ate 
ile 


gcg 
ala 


att gac ttc 
ile asp phe 


tgc 
cys 


age 
ser 


acc acc ccg 
thr thr pro 


cag 
gin 


gtc 
val 


att gac ggg 
ile asp gly 


age 
ser 


aat 
asn 


ggc gac tac 
gly asp tyr 


teg 
ser 


atg 
met 


ate teg acg 
ile ser thr 


ttc 
phe 


ate 
ile 


ggt aac age 
gly asn ser 


teg 
ser 


ttg 
leu 


cag cat atg 
gin his met 


gac 
asp 


cag 
gin 


aac ggc gac 
asn gly asp 


ate 
ile 


gac 
asp 


gac gat ccg 
asp asp pro 


ccg 
pro 


teg 
ser 


acc ccg ccg 
thr pro pro 


cag 
gin 


cac 
his 


cag cag gtt 
gin gin val 


acc 
thr 


ggc 
gly 


cag gcc ggt 
gin ala gly 


gtg 
val 


atg 
met 


get ccg gac 
ala pro asp 


gly 


aac 
asn 


gaa cag get 
glu gin ala 


gtg 
val 


acc 
thr 


ggg ate ggc 
gly ile gly 



SEQ ID 



691/231 

ggt atg gac tct cgt 
gly met asp ser arg 
751/251 

ggc ggc gca cgt teg 
gly gly ala arg ser 
811/271 

gtc gcg gtg teg ttc 
val ala val ser phe 
871/291 

ccc gag acc ggt aag 
pro glu thr gly lys 
931/311 

ctg gtg tac acg gag 
leu val tyr thr glu 
991/331 

gtg aag gtc att cag 
val lys val ile gin 
1051/351 

gtc ggt ttc gcg egg 
val gly phe ala arg 
1111/371 

ttg egg gac tac gaa 
leu arg asp tyr glu 
1171/391 

ccg acc gcg ctg aac 
pro thr ala leu asn 
1231/411 

ggg cgc ate aaa cgc 
gly arg ile lys arg 
1291/431 

gac acc ttg ttc aac 
asp thr leu phe asn 
1351/451 

tac gtg gac aac gtc 
tyr val asp asn val 
1411/471 

gcg gcc ggg cac gtc 
ala ala gly his val 
1471/491 

gag ccc ccg cgt acc 
glu pro pro arg thr 
1531/511 

ctg ccc ctg gaa aac 
leu pro leu glu asn 
1591/531 

acc ace acc aag aag 
thr thr thr lys lys 
1651/551 

acg acg acc teg cca 
thr thr thr ser pro 
1711/571 

ttg gcc acc acc gcc 
leu ala thr thr ala 
1771/591 

gac tac ccg agt teg 
asp tyr pro ser ser 
1831/611 

gcc gcc acc gtg gcc 
ala ala thr val ala 
1891/631 

caa ctg gtc cag gtg 
gin leu val gin val 



N° 32D (suite 1) 



gcc ggg gcg 
ala gly ala 


aac 
asn 


gcc 
ala 


gac acc gtc 
asp thr val 


atg 
met 


ctg 
leu 


ccc cgc gac 
pro arg asp 


ctg 
leu 


gcg 
ala 


tac gga ccc 
tyr gly pro 


ate 
ile 


tac 
tyr 


acc aag ctg 
thr lys leu 


aac 
asn 


teg 
ser 


aaa ctg teg 
lys leu ser 


ggc 
gly 


ttg 
leu 


atg gtc gag 
met val glu 


gcc 
ala 


etc 
leu 


ctg ggc acg 
leu gly thr 


gtg 
val 


ctg 
leu 


tat gtg cgc 
tyr val arg 


get 
ala 


cgc 
arg 


cag cag ttg 
gin gin leu 


ttt 
phe 


ttg 
leu 


etc age agg 
leu ser arg 


etc 
leu 


aac 
asn 


aag acc aaa 
lys thr lys 


gac 
asp 


ctg 
leu 


acg ttc gtg 
thr phe val 


acc 
thr 


gtt 

val 


tec gac atg 
ser asp met 


aag 
lys 


gcg 
ala 


gat cac aac 
asp his asn 


gcc 
ala 


cag 
gin 


gcg ccg cag 
ala pro gin 


gcg 
ala 


ggt 

gly 


aaa gag gtc 
lys glu val 


aca 
thr 


gtg 
val 


acc gat cag 
thr asp gin 


etc 
leu 


aag 
lys 


ctg ctg gcc 
leu leu ala 


acc 
thr 


aca 
thr 


gcc gtg ttc 
ala val phe 


ggc 

gly 


cag 
gin 


gtg ctg ggc 
val leu gly 


caa 
gin 


gac 
asp 



FEUILLE DE (CifiH^^Elttft&LE 26) 



WO 99/09186 




, CT/FR98/018I3 



100/185. 



1921/641 

ttc age gcg gtg cgc 
phe ser ala val arg 
1981/661 

aac tec tec age cca 
asn ser ser ser pro 
2041/661 

acc acc tgc gag tag 
thr thr cys glu AMB 



get ccc ctg ccg agt 
ala pro leu pro ser 

ccg acc aag ctg ccc 
pro thr lys leu pro 



1951/651 

ggc tec acc gtc age 
gly ser thr val ser 
2011/671 

gag gac ctg acg gtc 
glu asp leu thr val 



gtg cag ata age cgc 
val gin ile ser arg 

acc aac gcc gcc gac 
thr asn ala ala asp 



SEQ ID N° 32D (suite 2) 
FIGURE 32D (suite 2> 



ORF d'apres Cole et al. (Nature 393:537-544) et contenant Rv0822c 
1/1 31/11 

tag gac atg agt gac ggc gag age gcc gcg ccg tgg gca egg etc tec gag tea gca ttc 
AMB asp met ser asp gly glu ser ala ala pro trp ala arg leu ser glu ser ala phe 
61/21 91/31 

ccc gat ggt gtt gac cga tgg ate acg gta ccg ccc gcc aca tgg gtg gca gcc cag ggt 
pro asp gly val asp arg trp ile thr val pro pro ala thr trp val ala ala gin gly 
121/41 151/51 

ccg egg gac acc cag aat gtc ggc tgt cat gcc acc ggc gcc gtt agt gtg gcc gat ctg 
pro arg asp thr gin asn val gly cys his ala thr gly ala val ser val ala asp leu 
181/61 211/71 

ate gcc agg etc ggc ccc get ttt cct gac etc ccc acg cac cgc cat gtc gcc ccc gaa 
ile ala arg leu gly pro ala phe pro asp leu pro thr his arg his val ala pro alu 
241/81 271/91 

ccc gag cca tec ggc cgc ggc ccg aag gtc cac gac gac gcc gac gac cag cag gac acc 
pro glu pro ser gly arg gly pro lys val his asp asp ala asp asp gin gin asp thr 
301/101 331/111 

gag get ate gcc ate ccg gcc cac teg etc gag ttc etc teg gag ctt ccc gac etc egg 
glu ala ile ala ile pro ala his ser leu glu phe leu ser glu leu pro asp leu arg 
361/121 391/131 

gca gcc aac tat ccg cgc gcc gac cac gcc cgc cgt gaa ccc gag eta ccc ggc aag cag 
ala ala asn tyr pro arg ala asp his ala arg arg glu pro glu leu pro gly lys gin 
421/141 451/151 

eta acc gga teg get cga gtg egg cca ttg egg ate cgc cga acg teg ccc gcg ccc gcc 
leu thr gly ser ala arg val arg pro leu arg ile arg arg thr ser pro ala pro ala 
481/161 511/171 



aag cca 
lys pro 
541/181 


gcg ccg 
ala pro 


aac 
asn 


tec 
ser 


ggc 

gly 


egg 

arg 


cgc 
arg 


ccg 
pro 


atg gtg 
met val 
571/191 


ctg 
leu 


gcc 
ala 


gcg 
ala 


cgc 
arg 


teg 
ser 


ctg 
leu 


gcg 
ala 


get 
ala 


ctg ttt 
leu phe 
601/201 


gcc get 
ala ala 


ctg 
leu 


gcg 
ala 


ttg 
leu 


gcg 
ala 


ctg 
leu 


acc 
thr 


ggc ggg 
gly gly 
631/211 


gca 
ala 


tgg 
trp 


cag 
gin 


tgg 
trp 


age 
ser 


gcg 
ala 


teg 
ser 


aag 

lys 


aac age 
asn ser 
661/221 


egg ctg 
arg leu 


aac 
asn 


atg 
met 


gta 
val 


age 
ser 


gcg 
ala 


etc 
leu 


gac ccg 
asp pro 
691/231 


cat 
his 


teg 
ser 


ggc 
gly 


gac 
asp 


ate 
ile 


gtc 
val 


aac 
asn 


ccc 
pro 


age ggg 
ser gly 
721/241 


cag cat 
gin his 


ggc 
gly 


gac 
asp 


gag 
glu 


aac 
asn 


ttc 
phe 


ttg 
leu 


etc gtc 
leu val 
751/251 


ggt 
gly 


atg 
met 


gac 
asp 


tct 
ser 


cgt 
arg 


gcc 
ala 


ggg 
gly 


gcg 
ala 


aac gcc 
asn ala 
781/261 


aat ate 
asn ile 


ggc 
gly 


gcc 
ala 


ggc 
gly 


gac 
asp 


gcc 
ala 


gag 
glu 


gac gcc 
asp ala 
811/271 


ggc 
gly 


ggc 
gly 


gca 
ala 


cgt 
arg 


teg 
ser 


gac 
asp 


acc 
thr 


gtc 
val 


atg ctg 
met leu 


gtc aac 
val asn 


att 
ile 


ccg 
pro 


gcc 
ala 


age 
ser 


cgc 
arg 


gag 
glu 


egg gtc 
arg val 


gtc 
val 


gcg 
ala 


gtg 
val 


teg 
ser 


ttc 
phe 


ccc 
pro 


cgc 
arg 


gac 
asp 



SEQ ID N° 32F 



FEUILLE DE REM|^gE|JE|^REGLE 26) 



WO 99/09186 




841/281 

ctg gcg ate act cca ate caa 
leu ala ile thr pro ile gin 
901/301 

ate tae gac gag aag acg gga 
ile tyr asp glu lys thr gly 
961/321 

aac teg gca ttc tec ttc ggc 
asn ser ala phe ser phe gly 
1021/341 

ggc ttg age ate aac egg ttc 
gly leu ser ile asn arg phe 
1081/361 

gee etc ggc ggc gtc gag gta 
ala leu gly gly val glu val 
1141/381 

gtg ctg gag cac gee gga cgc 
val leu glu his ala gly arg 
1201/401 

get cgc cag gtc ace ace gag 
ala arg gin val thr thr glu 
1261/421 

ttt ttg teg teg ctg ctg cgt 
phe leu ser ser leu leu arg 
1321/441 

etc aac aac gtc gtc aac atg 
leu asn asn val val asn met 
1381/461 

gac ctg gtc gaa etc ggt cga 
asp leu val glu leu gly arg 
1441/481 

ace gtt ccg acc ggt at a acc 
thr val pro thr gly ile thr 

:1501/501 

aag gcg ctt ttc acc gee ate 
lys ala leu phe thr ala ile 
=1561/521 

gee cag cgt ctg ggc aac acg 
ala gin arg leu gly asn thr 
1621/541 

gcg ggt ctg acc aac gag att 
ala gly leu thr asn glu ile 
1681/561 

aca gtg cag gtc tct aac teg 
thr val gin val ser asn ser 
1741/581 

etc aag egg aac ggc ttc aac 
leu lys arg asn gly phe asn 
1801/601 

acc aca gtg ttt ttt teg ccc 
thr thr val phe phe ser pro 
1861/621 

ggc cag tea aag ate gag egg 
gly gin ser lys ile glu arg 
1921/641 

caa gac ttc age gcg gtg cgc 
gin asp phe ser ala val arg 
1981/661 

age cgc aac tec tec age cca 
ser arg asn ser ser ser pro 
2041/681 

gee gac acc acc tgc gag tag 
ala asp thr thr cys glu AMB 



101/185 

871/291 
tgc gag gcg tgg aac ccc gag 
cys glu ala trp asn pro glu 

931/311 
acg atg ggt ccc aga ctg gtg 
thr met gly pro arg leu val 

991/331 
ggg cct aag tgt eta gtg aag 
gly pro lys cys leu val lys 

1051/351 
ate gcg att gac ttc gtc ggt 
ile ala ile asp phe val gly 

1111/371 
tgc age acc acc ccg ttg egg 
cys ser thr thr pro leu arg 

1171/391 
cag gtc att gac ggg ccg acc 
gin val ile asp gly pro thr 

1231/411 
age aat ggc gac tac ggg cgc 
ser asn gly asp tyr gly arg 

1291/431 
teg atg ate teg acg gac acc 
ser met ile ser thr asp thr 

1351/451 
ttc ate ggt aac age tac gtg 
phe ile gly asn ser tyr val 

1411/471 
teg ttg cag cat atg gcg gec 
ser leu gin his met ala ala 

1471/491 
gac cag aac ggc gac gag ccc 
asp gin asn gly asp glu pro 

1531/511 
ate gac gac gat ccg ctg ccc 
ile asp asp a3p pro leu pro 

1591/531 
ccg teg acc ccg ccg acc acc 
pro ser thr pro pro thr thr 

1651/551 
cag cac cag cag gtt acg acg 
gin his gin gin val thr thr 

1711/571 
acc ggc cag gec ggt ttg gec 
thr gly gin ala gly leu ala 

1771/591 
gtg atg get ccg gac gac tac 
val met ala pro asp asp tyr 

1831/611 
ggc aac gaa cag get gee gee 
gly asn glu gin ala ala ala 

1891/631 
gtg acc ggg ate ggc caa ctg 
val thr gly ile gly gin leu 

1951/651 
get ccc ctg ccg agt ggc tec 
ala pro leu pro ser gly 3er 

2011/671 
ccg acc aag ctg ccc gag gac 
pro thr lys leu pro glu asp 



SEQ ID 32F (suite 



• CT/FR98/01813 



ace 
thr 


ggt aag 
gly lys 


tac 
tyr 


gga 

giy 


ccc 
pro 


tac 
tyr 


acg gag 
thr glu 


acc 
thr 


aag 
lys 


ctg 
leu 


gtc 
val 


att cag 
ile gin 


aaa 
lys 


ctg 
leu 


teg 
ser 


ttc 
phe 


gcg egg 
ala arg 


atg 
met 


gtc 
val 


gag 
glu 


gac 
asp 


tac gaa 
tyr glu 


ctg 
leu 


ggc 
gly 


acg 
thr 


gcg 
ala 


ctg aac 
leu asn 


tat 
tyr 


gtg 
val 


cgc 
arg 


ate 
ile 


aaa cgc 
lys arg 


cag 
gin 


cag 
gin 


ttg 
leu 


ttg 
leu 


ttc aac 
phe asn 


etc 
leu 


age 
ser 


agg 
arg 


gac 
asp 


aac gtc 
asn val 


aag 
lys 


acc 
thr 


aaa 
lys 


ggg 

gly 


cac gtc 
his val 


acg 
thr 


ttc 
phe 


gtg 
val 


ccg 
pro 


cgt acc 
arg thr 


tec 
ser 


gac 
asp 


atg 
met 


ctg 
leu 


gaa aac 
glu asn 


gat 
asp 


cac 
his 


aac 
asn 


acc 
thr 


aag aag 
lys lys 


gcg 
ala 


ccg 
pro 


cag 
gin 


acc 
thr 


teg cca 
ser pro 


aaa 
lys 


gag 
glu 


gtc 
val 


acc 
thr 


acc gec 
thr ala 


acc 
thr 


gat 
asp 


cag 
gin 


pro 


agt teg 
ser ser 


ctg 
leu 


ctg 
leu 


gee 
ala 


acc 
thr 


gtg gec 
val ala 


gec 
ala 


gtg 
val 


ttc 
phe 


gtc 
val 


cag gtg 
gin val 


gtg 
val 


ctg 
leu 


ggc 
gly 


acc 
thr 


gtc age 
val ser 


gtg 
val 


cag 
gin 


ata 
ile 


ctg 
leu 


acg gtc 
thr val 


acc 
thr 


aac 
asn 


gee 
ala 



1) 



FEUILLE EkWhtiffiE^ftk^ 26) 




WO 99/09186 ^PpCT/FR98/01813 



102/185 



1/1 

CGT CAC CTC TGC 
arg his leu cys 
61/21 

CAT GCA GAG TCG 
his ala glu ser 
121/41 

GGC CGA CAT TCG 
gly arg his ser 
181/61 

ATT GAT ACG ATT 
ile asp thr ile 



CAT GGT CCA TCT 
his gly pro ser 

GTG TTC GCT TCA 
val phe ala ser 

CCC GAG GCC TTG 
pro glu ala leu 

GCG CAC ATG GCT 
ala his met ala 







31/11 


ACG 


GTA 


TCT GCG 


thr 


val 


ser ala 






91/31 


CGC 


GAA 


CTA GGC 


arg 


glu 


leu gly 






151/51 


GCC 


TCC 


ATC ACC 


ala 


ser 


ile thr 






211/71 


ATC 


TGG 


GAT C 


ile 


trp 


asp 



ACA AGG GCA GCG 
thr arg ala ala 

GCG CCT AGC CTG 
ala pro ser leu 

TAA TTG TGT GCA 
OCH leu cys ala 



TCG ATC CCT CGA 
ser ile pro arg 

GAC GAG TCC CCG 
asp glu ser pro 

AAA CCG TAT CTA 
lys pro tyr leu 



SEQ ID N° 33A 



FIGURE 33A 



1/1 

GTC ACC TCT GCC ATG GTC CAT 
val thr ser ala met val his 
61/21 

ATG CAG AGT CGG TGT TCG CTT 
met gin ser arg cys ser leu 
121/41 

GCC GAC ATT CGC CCG AGG CCT 
ala asp ile arg pro arg pro 
181/61 

TTG ATA CGA TTG CGC ACA TGG 
leu ile arg leu arg thr trp 









31/11 




CTA 


CGG 


TAT 


CTG CGA 


CAA 


leu 


arg 


tyr 


leu arg 
91/31 


gin 


CAC 


GCG 


AAC 


TAG GCG 


CGC 


his 


ala 


asn 


AMB ala 


arg 








151/51 


TGG 


CCT 


CCA 


TCA CCT 


AAT 


trp pro 


pro 


ser pro 


asn 








211/71 




CTA 


TCT 


GGG 


ATC 




leu 


ser 


gly 


ile 





SEQ ID N° 33B 
FIGURE 33B 



GGG 


CAG 


CGT 


CGA TCC 


CTC 


GAC 


gly gin arg 


arg 


ser 


leu 


asp 


CTA 


GCC 


TGG 


ACG 


AGT 


CCC 


CGG 


leu 


ala 


trp 


thr 


ser 


pro 


arg 


TGT 


GTG 


CAA 


AAC 


CGT 


ATC 


TAA 


cys 


val 


gin 


asn 


arg 


ile 


OCH 



1/1 

CCG TCA CCT CTG CCA TGG TCC ATC TAC GGT 
pro ser pro leu pro trp ser ile tyr gly 
61/21 

ACA TGC AGA GTC GGT GTT CGC TTC ACG CGA 
thr cys arg val gly val arg phe thr arg 
121/41 

GGG CCG ACA TTC GCC CGA GGC CTT GGC CTC 
gly pro thr phe ala arg gly leu gly leu 
181/61 

AAT TGA TAC GAT TGC GCA CAT GGC TAT CTG 
asn OPA tyr asp cys ala his gly tyr leu 



31/11 



ATC TGC 


GAC 


AAG 


GGC 


AGC 


GTC 


GAT 


CCC 


TCG 


ile cys 


asp 


lys gly 


ser 


val 


asp 


pro 


ser 


91/31 














ACT AGG 


CGC 


GCC 


TAG 


CCT 


GGA 


CGA 


GTC 


CCC 


thr arg 


arg 


ala 


AMB 


pro 


gly arc 


val 


pro 


151/51 
















CAT CAC 


CTA 


ATT 


GTG 


TGC 


AAA 


ACC 


GTA 


TCT 


his his 


leu 


ile 


val 


cys 


lys 


thr 


val 


ser 


211/71 















GGA TC 
gly 



SEQ ID N° 33C 



FEUILLE DE REI^LA&EN? (REGLE 26) 



WO 99/09186 




'CT/FR98V01813 



103/185 



sequence Rvl044 predite 


par 


Cole et 


al. 


1/1 
















ttg tgt 
leu cys 
61/21 


gca 
ala 


aaa ccg 
lys pro 


tat 
tyr 


eta 
leu 


att 
ile 


gat acg 
asp thr 


gtc gag 
val glu 
121/41 


gtt 
val 


gcc gcc 
ala ala 


gag 
glu 


caa 

gin 


cat 
his 


ggc tac 
gly tyr 


gtc gac 
val asp 
181/61 


cct 
pro 


gtg cag etc 
val gin leu 


cgc 
arg 


etc 
leu 


eta 
leu 


gcg 
ala 


ggt gtg 
gly val 
241/81 


tac 
tyr 


egg gtg 
arg val 


ccc 
pro 


gtg ctg 
val leu 


ccg 
pro 


cgt 
arg 


teg tgg 
ser trp 

JO1/101 


act 
thr 


ttg ggg cgt 
leu gly arg 


ggc gtt 
gly val 


ate 
ile 


teg 
ser 


get gac 
ala asp 
361/121 


gtg 
val 


aac ccg 
asn pro 


teg 
ser 


cgc 
arg 


ate 
ile 


cat 
his 


etc 
leu 


gcc ggg 
ala gly 
421/141 


ggc 
gly 


gag ctg tac 
glu leu tyr 


cga 
arg 


gtt 
val 


cac 
his 


cgc 
arg 


gtc gac 
val asp 
481/161 


gga 
gly 


ata ccc 
ile pro 


gtc 
val 


acg 
thr 


acg 
thr 


gtt gcg 
val ala 


acg gat 
thr asp 
541/181 


cct 
pro 


tat cag ctt 
tyr gin leu 


egg 
arg 


gcc 
ala 


gcg 
ala 


ate 
ile 


cgt ggg 
arg gly 
601/201 


tea 
ser 


gca get 
ala ala 


gag 
glu 


eta 

leu 


cgc 
arg 


get gcg 
ala ala 


egg ccg 
arg pro 


aag 
lys 


cga gca 
arg ala 


teg 
ser 


gcg 
ala 


tga 
OPA 







(Nature 


393: 


i537-544) 


et 


contenant seq33A 


31/11 


















att gcg 
ile ala 
91/31 


cac 
his 


atg 
met 


get 
ala 


ate 
ile 


tgg 
trp 


gat 
asp 


cgc 
arg 


etc 
leu 


gtc acg 
val thr 
151/51 


act 
thr 


cgc 
arg 


gat 
asp 


aca 

y*~y 
ala 


cga 
arg 


gac 
asp 


ate 
ile 


ggc 
gly 


ggg cgc gga 
gly arg gly 
211/71 


cgt 
arg 


ctt 
leu 


y a y 
glu 


cgt 
arg 


gtc 
val 


ggc 
gly 


cga 
arg 


ggt gag 
gly glu 
271/91 


cac 
his 


gac 
asp 


gat 
asp 


etc 
leu 


gca 
ala 


gcc 
ala 


gca 
ala 


gtg 
val 


cat gag 
his glu 
331/111 


teg 
ser 


gcc 
ala 


ttg 
leu 


aca 
ala 


ctt 
leu 


cat 
his 


gcc 
ala 


etc 
leu 


ace gtc 
thr val 
391/131 


ccg 
pro 


cgc 
arg 


aac 
asn 


aac 
asn 


cat 
his 


ccg 
pro 


cgt 
arg 


gcg 
ala 


cgc gac 
arg asp 
451/151 


etc 
leu 


cag 
gin 


gca 
ala 


gcc 
ala 


cac 
his 


gtc 
val 


act 
thr 


teg 
ser 


cgc acc 
arg thr 
511/171 


ate 
ile 


aaa 

lys 


gac 
asp 


tgc 
eys 


gtg 
val 


aag 
lys 


acg 
thr 


ggc 
gly 


gag cga 
glu arg 
571/191 


gcc 
ala 


gaa 
glu 


gcc 
ala 


gag 
glu 


ggc 
gly 


acg 
thr 


ctt 
leu 


cgt 
arg 


etc gat 
leu asp 


gag 
glu 


acc 
thr 


act 
thr 


gcc 
ala 


gga 
gly 


tta 
leu 


cgc 
arg 


get 
ala 



SEQ ID N° 33D 
FIGURE 33D 



FEUILLE DE REMPLACEMENT (REGLE 26) 




WO 99/09186 ^ ,f WPCT/FR98/01813 

104/185 



ORF d'apres Cole et al. {Nature 393:537-544) et contenant Rvl044 



1/1 

taa ttg 
OCH leu 
61/21 
etc gtc 
leu val 
121/41 
ggc gtc 
gly val 
181/61 
cga ggt 
arg gly 
241/81 
gtg teg 
val ser 
301/101 
etc get 
leu ala 
361/121 
gcg gee 
ala ala 
421/141 
teg gtc 
ser val 
481/161 
ggc acg 
gly thr 
541/181 
cgt cgt 
arg arg 
601/201 
get egg 
ala arg 



tgt gca 
cys ala 

gag gtt 
glu val 

gac cct 
asp pro 

gtg tac 
val tyr 

tgg act 
trp thr 

gac gtg 
asp val 

ggg ggc 
gly gly 

gac gga 
asp gly 

gat cct 
asp pro 

ggg tea 
gly ser 



aaa ccg tat 
lys pro tyr 

gec gec gag 
ala ala glu 

gtg cag etc 
val gin leu 

egg gtg ccc 
arg val pro 

ttg ggg cgt 
leu gly arg 

aac ccg teg 
asn pro ser 

gag ctg tac 
glu leu tyr 

ata ccc gtc 
ile pro val 

tat cag ctt 
tyr gin leu 

gca get gag 
ala ala glu 









31/11 








eta 
leu 


att 
ile 


gat 
asp 


thr ile 
91/31 


gcg 
ala 


cac 
his 


atg get ate 
met ala ile 


caa 
gin 


cat 
his 


gly 


tac gtc 
tyr val 
151/51 


acg 
thr 


act 
thr 


cgc gat gcg 
arg asp ala 


cgc 
arg 


etc 
leu 


eta 
leu 


ala gly 
211/71 


cgc gga cgt ctt gag 
arg gly arg leu glu 


gtg ctg 
val leu 


cca 
pro 


cert aat. 
arg gly 
271/91 


gag cac 
glu his 


gac gat etc 
asp asp leu 


ggc gtt 
gly val 


ate 
ile 


teg cat 
ser his 
331/111 


gag 
glu 


teg 
ser 


gec ttg gcg 
ala leu ala 


cgc 
arg 


ate 
ile 


cat 
his 


etc acc 

leu thr 
•iqi /in 


gtc 
val 


ccg 
pro 


cgc aac aac 
arg asn asn 


cga 
arg 


gtt 
val 


cac 
his 


cgc cgc 
arg arg 
451/151 


gac etc cag gca gec 
asp leu gin ala ala 


acg 
thr 


acg 
thr 


gtt 
val 


gcg cgc 
ala arg 
511/171 


acc 
thr 


ate 
ile 


aaa gac tgc 
lys asp cys 


egg 
arg 


gec 
ala 


gcg 
ala 


ate gag 
ile glu 
571/191 


cga 
arg 


gee 
ala 


gaa gec gag 
glu ala glu 


eta 
leu 


cgc 
arg 


get 
ala 


gcg etc 
ala leu 


gat gag 
asp glu 


acc act gec 
thr thr ala 


gcg 
ala 


tga 
OPA 













tgg gat cgc 
trp asp arg 

cga gac ate 
arg asp ile 

cgt gtc ggc 
arg val gly 

gca gec gca 
ala ala ala 

ctt cat gec 
leu his ala 

cat ccg cgt 
his pro arg 

cac gtc act 
his val thr 

gtg aag acg 
val lys thr 

ggc acg ctt 
gly thr leu 

gga tta cgc 
gly leu arg 



SEQ ID N° 33F 
FIGURE 33F 



1/1 

ATC CAA CCT GCT GGG 
ile gin pro ala gly 
61/21 

ACA ACA CCT GGA ATG 
thr thr pro gly met 
121/41 

CCT CGG TCG AGA CGT 
pro arg ser arg arg 
181/61 

CGC CGC ATA TTT GCC 
arg arg ile phe ala 



CCT GCG CCT TCG AAT 
pro ala pro ser asn 

GGG ACC TTT TCG GTG 
gly thr phe ser val 

ATC GCG GCA GCG TTG 
ile ala ala ala leu 

GCG CTG CCG CGG GCC 
ala leu pro arg ala 



31/11 

CGA CGG CCA GGC CAC 
arg arg pro gly his 
91/31 

TTG CTG GTA ACC GGG 
leu leu val thr gly 
151/51 

GCC CTG TCG TTG CTG 

ala leu ser leu leu 

211/71 

GGA TC 

gly 



CGC TCG CTG CCG GCA 
arg ser leu pro ala 

ACA ACC GGC ACC ACG 
thr thr gly thr thr 

ACA ATT ACC GCT GGC 
thr ile thr ala gly 



SEQ ID N° 34A 



FEUILLE DE REIVlHS® E$f (REGLE 26) 




WO 99/09186 ^PPCT/FR98/01 813 

105/185 



1/1 

TCC AAC CTG CTG GGC 
ser asn leu leu gly 
61/21 

CAA CAC CTG GAA TGG 
gin his leu glu trp 
121/41 

CTC GGT CGA GAC GTA 
leu gly arg asp val 
181/61 

GCC GCA TAT TTG CCG 
ala ala tyr leu pro 



CTG CGC CTT CGA ATC 
leu arg leu arg ile 

GGA CCT TTT CGG TGT 
gly pro phe arg cys 

TCG CGG CAG CGT TGG 
ser arg gin arg trp 

CGC TGC CGC GGG CCG 
arg cys arg gly pro 



31/11 

GAC GGC CAG GCC ACC 
asp gly gin ala thr 
91/31 

TGC TGG TAA CCG GGA 
cys trp OCH pro gly 
151/51 

CCC TGT CGT TGC TGA 

pro cys arg cys OPA 

211/71 

GAT C 

asp 



GCT 


CGC 


TGC 


CGG 


CAA 


ala 


arg 


cys 


arg 


gin 


CAA 


CCG 


GCA 


CCA 


CGC 


gin 


pro 


ala 


pro 


arg 


CAA 


TTA 


CCG 


CTG 


GCC 


gin 


leu 


pro 


leu 


ala 



SEQ ID N° 34B 
FIGURE 34B 



1/1 

GAT CCA ACC TGC 
asp pro thr cys 
61/21 

AAC AAC ACC TGG 
asn asn thr trp 
121/41 

GCC TCG GTC GAG 
ala ser val glu 
181/61 

CCG CCG CAT ATT 
pro pro his ile 



TGG GCC TGC GCC 
trp ala cys ala 

AAT GGG GAC CTT 
asn gly asp leu 

ACG TAT CGC GGC 
thr tyr arg gly 

TGC CGC GCT GCC 
cys arg ala ala 







31/11 


TTC 


GAA 


TCG ACG 


phe 


glu 


ser thr 






91/31 


TTC 


GGT 


GTT GCT 


phe 


gly 


val ala 






151/51 


AGC 


GTT 


GGC CCT 


ser 


val 


gly pro 






211/71 


GCG 


GGC 


CGG ATC 


ala 


gly 


arg ile 



SEQ ID N° 34C 
FIGURE 34C 



GCC AGG CCA CCG 
ala arg pro pro 

GGT AAC CGG GAC 
gly asn arg asp 

GTC GTT GCT GAC 
val val ala asp 



CTC GCT GCC GGC 
leu ala ala gly 

AAC CGG CAC CAC 
asn arg his his 

AAT TAC CGC TGG 
asn tyr arg trp 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 




•CT/FR98/01813 



106/185 



ORF d'apres Cole et al. (Nature 393:537-544) contennant seq34A 



1/1 








31/11 


















tag ccg cag ggc cct gcg 
AMB pro gin gly pro ala 
61/21 


get 
ala 


agg cgc 
arg arg 


ggc 


egg tgc 
arg cys 
91/31 


cgt 

xi ret 


tgg 
crp 


ccg 
pro 


egg 
a rg 


egg 
arg 


caa 
gin 


teg 
ser 


atg 
met 


ttg cag cag tta caa cgc 
leu gin gin leu gin arg 
121/41 


caa atg gag 
gin met glu 


tct 

ser 


gag cgc 
glu arg 
151/51 


ate 
ile 


gtc 

Vui, 


gag 


ttc 
phe 


gat 
asp 


cag 
gin 


etc 
leu 


ggc 
gly 


agg gga gac gtt gcg cag 
arg gly asp val ala gin 
181/61 


cga 
arg 


egg ate 
arg ile 


caa 
gin 


cct get 

nrn ala 

211/71 


ggg 


cct 
pro 


gcg 

al a 

did 


cct 
pro 


teg 
ser 


aat 
asn 


cga 
arg 


egg 
arg 


cca ggc cac cgc teg ctg 
pro gly his arg ser leu 
241/81 


ccg 
pro 


gca aca 
ala thr 


aca 
thr 


cct gga 
271/91 


atg 
met 


ggg 

gly 


acc 


ttt 
phe 


teg 
ser 


gtg 
vai 


ttg 
leu 


ctg 

i «... 
leu 


gta acc ggg aca acc ggc 
val thr gly thr thr gly 
301/101 


acc 
thr 


acg cct 
thr pro 


egg 
arg 


teg aga 
ser arg 
331/111 


cgt 
arg 


ate 
ile 


acq 
ala 


aca 
ala 


oca 
ala 


ttg 
leu 


ala 


ctg 
leu 


teg ttg ctg aca att acc 
ser leu leu thr ile thr 
361/121 


get 
ala 


ggc cgc 
gly arg 


cgc 
arg 


ata ttt 
ile phe 
391/131 


gee 
ala 


gcg 
ala 


ctg 
leu 


ccg 
pro 


egg 
arg 


gee 
ala 


gga 

gly 


tec 
ser 


agg teg acc tgc cag ate 
arg ser thr cys gin ile 
421/141 


tea 
ser 


ccg cgc 
pro arg 


age 
ser 


ate tac 
ile tyr 
451/151 


gee 
ala 


gtt 
val 


cgc 
arg 


tgc 
cys 


aaa 
lys 


ccg 
pro 


ccg 
pro 


act 
thr 


gcg acg gca ggc cca etc 
ala thr ala gly pro leu 
481/161 


tct 
ser 


tgg cat 
trp his 


gcg 
ala 


tec aat 
ser asn 
511/171 


get 
ala 


gcg 
ala 


acg 
thr 


tec 
ser 


teg 
ser 


gta 
val 


gac 

asp 


aag 
lys 


etc acg ctt ggc ttc atg 
leu thr leu gly phe met 


ccg cag tec 
pro gin ser 


tac 
tyr 


cca tgt 
pro cys 


agt 
ser 


aac 
asn 


aga 
arg 


tag 
AMB 











SEQ ID N° 34 F 
FIGURE 34 F 



1/1 








31/11 


















CAG TCT GTC GGC AAG 


GAG 


GGA CGC ATG 


CCA 


CTC TCC 


GAT 


CAT 


GAG 


CAG 


CGG 


ATG 


CTT 


GAC 


gin ser val gly lys 


glu 


gly arg met 


pro 


leu ser 


asp 


his 


glu 


gin 


arg 


met 


leu 


asp 


61/21 








91/31 








CAG ATC GAG AGC GCT 


CTC 


TAC GCC GAA 


GAT 


CCC AAG 


TTC 


GCA 


TCG 


AGT 


GTC 


CGT 


GGC 


GGG 


gin ile glu ser ala 


leu 


tyr ala glu 


asp 


pro lys 


phe 


ala 


ser 


ser 


val 


arg 


gly 


gly 


121/41 








151/51 












GGC TTC CGC GCA CCG 


ACC 


GCG CGG CGG 


CGC 


CTG CAG 


GGC 


GCG 


GCG 


TTG 


TTC 


ATC 


ATC 


GGT 


gly phe arg ala pro 


thr 


ala arg arg 


arg 


leu gin 


gly 


ala 


ala 


leu 


phe 


ile 


ile 


gly 


181/61 








211/71 














CTG GGG ATG TTG GTT 


TCC 


GGC GTG GCG 


TTC 


AAA GAG 


ACC 


ATG 


ATC 


GGA 


AGT 


TTC 


CCG 


ATA 


leu gly met leu val 


ser 


gly val ala 


phe 


lys glu 


thr 


met 


ile 


gly 


ser 


phe 


pro 


ile 


241/81 








271/91 










CTC AGC GTT TTC GGT 


TTT 


GTC GTG ATG 


TTC 


GGT GGT 


GTG 


GTG 


TAT 


GCC 


ATC 


ACC 


GGT 


CCT 


leu ser val phe gly phe 
301/101 


val val met 


phe 


gly gly 
331/111 


val 


val 


tyr 


ala 


ile 


thr 


gly 


pro 


CGG TTG TCC GGC AGG 


ATG 


GAT CGT GGC 


GGA 


TCG GCT 


GCT 


GGG 


GCT 


TCG 


CGC 


CAG 


CGT 


CGT 


arg leu ser gly arg 
361/121 


met 


asp arg gly 


gly 


ser ala 
391/131 


ala 


gly 


ala 


ser 


arg 


gin 


arg 


arg 


ACC AAG GGG GCC GGG 


GGC 


TCA TTC ACC 


AGC 


CGT ATG 


GAA 


GAT 


C 












thr lys gly ala gly gly 


ser phe thr 


ser 


arg met 


glu 


asp 















SEQ ID N° 35A 
FEUILLE DE REIU|P^EM|^ J (REGLE 26) 



WO 99/09186 




CT/FR98/01813 



107/185 



1/1 

GAC AGT 
asp ser 
61/21 
ACC AGA 
thr arg 
121/41 
GGG GCT 

gly ala 

181/61 
GTC TGG 
val trp 
241/81 
TAC TCA 
tyr ser 
301/101 
CTC GGT 
leu gly 
361/121 













31/11 














TCG 


GCA 


AGG AGG GAC 


GCA 


TGC 


CAC TCT 


CCG 


ATC ATG AGC 


AGC 


GGA 


J. 




ser 


ala 


arg arg asp 


ala 


cys 


his ser 


pro 


ile met ser 


ser 






leu 












91/31 










AGA GCG 


CTC TCT ACG 


CCG 


AAG 


ATC CCA 


AGT 


TCG CAT CGA 


GTG 


A Vol* 


oi b 




arg 


ala 


leu ser thr 


pro 


lys 


ile pro 


ser 


ser his arrr 


val 


ser 


vax 


ala 












151/51 










GCG 


CAC 


CGA CCG CGC 


GGC 


GGC 


GCC TGC 


AGG 


GCG CGG CGT 


TGT 


TCA 


TCA 


TCG 


ala 


his 


arg pro arg gly 


gly 


ala cys 


arg 


ala arg arg 


cys 


ser 


ser 


ser 












211/71 










TGT 


TGG 


TTT CCG GCG 


TGG 


CGT 


TCA AAG 


AGA 


CCA TGA TCG 


GAA 


GTT 


TCC 


CGA 


cys 


trp phe pro ala 


trp 


arg 


ser lys 


arg 


pro OPA ser 


glu 


val 


ser 


arg 












271/91 










TTT 


TCG 


GTT TTG TCG 


TGA 


TGT 


TCG GTG 


GTG 


TGG TGT ATG 


CCA 


TCA 


CCG 


GTC 


phe 


ser 


val leu ser 


OPA 


cys 


ser val 


val 


trp cys met 


pro 


ser 


pro 


val 












331/111 










CCG 


GCA 


GGA TGG ATC 


GTG 


GCG 


GAT CGG 


CTG 


CTG GGG CTT 


CGC 


GCC 


AGC 


GTC 


pro 


ala 


gly crp ile val 


ala 


asp arg 


leu 


leu gly leu 


arg 


ala 


ser 


val 












391/131 












GGG 


CCG 


GGG GCT CAT 


TCA 


CCA 


GCC GTA 


TGG 


AAG ATC 










gly pro 


gly ala his 


ser 


pro 


ala val 


trp 


lys ile 











SEQ ID N° 35B 
FIGURE 35B 



1/1 

ACA GTC TGT CGG CAA 
thr val cys arg gin 
61/21 

CCA GAT CGA GAG CGC 
pro asp arg glu arg 
121/41 

GGG CTT CCG CGC ACC 
gly leu pro arg thr 
181/61 

TCT GGG GAT GTT GGT 
ser gly asp val gly 
241/81 

ACT CAG CGT TTT CGG 
thr gin arg phe arg 
301/101 

TCG GTT GTC CGG CAG 
ser val val arg gin 
361/121 

TAC CAA GGG GGC CGG 
tyr gin gly giy arg 



GGA GGG ACG CAT GCC 
gly gly thr his ala 

TCT CTA CGC CGA AGA 
ser leu arg arg arg 

GAC CGC GCG GCG GCG 
asp arg ala ala ala 

TTC CGG CGT GGC GTT 
phe arg arg gly val 

TTT TGT CGT GAT GTT 
phe cys arg asp val 

GAT GGA TCG TGG CGG 
asp gly ser crp arg 

GGG CTC ATT CAC CAG 
gly leu ile his gin 



31/11 








ACT CTC 


CGA 


TCA 


TGA 


thr leu 


arg 


ser 


OPA 


91/31 








TCC CAA 


GTT 


CGC 


ATC 


ser gin 


val 


arg 


ile 


151/51 






CCT GCA 


GGG 


CGC 


GGC 


pro ala 


gly 


arg gly 


211/71 








CAA AGA 


GAC 


CAT 


GAT 


gin arg 


asp 


his 


asp 


271/91 






CGG TGG 


TGT 


GGT 


GTA 


arg trp 


cys 


gly 


val 


331/111 








ATC GGC 


TGC 


TGG 


GGC 


ile gly 


cys 


Crp gly 


391/131 








CCG TAT 


GGA 


AGA TC 


pro tyr 


gly 


arg 





GCA 


GCG 


GAT 


GCT 


TGA 


ala 


ala 


asp 


ala 


OPA 


GAG 


TGT 


CCG 


TGG 


CGG 


glu 


cys 


pro 


trp 


arg 


GTT 


GTT 


CAT 


CAT 


CGG 


val 


val 


his 


his 


arg 


CGG 


AAG 


TTT 


CCC 


GAT 


arg 


lys 


phe 


pro 


asp 


TGC 


CAT 


CAC 


CGG 


TCC 


cys 


his 


his 


arg 


ser 


TTC 


GCG 


CCA 


GCG 


TCG 


phe 


ala 


pro 


ala 


ser 



SEQ ID N° 35C 
FEUILLE DE REII/lKSKS&IE^ff (REGLE 26) 



WO 99/09186 




•CT/FR98/01813 



108/185 



sequence Rv2169c predite par Cole et al. {Nature 393:537-544) et contenant 
par tiel lement seq35A 



1/1 








atg cca 


etc 


tec 


gat 


Met pro 


leu 


ser 


asp 


61/21 








gaa gat 


ccc 


aag 


ttc 


glu asp 


pro 


lys 


phe 


121/41 








egg cgc 


ctg 


cag 


ggc 


arg arg 


leu 


gin 


gly 


181/61 








gcg ttc 


aaa 


gag 


acc 


ala phe 


lys 


glu 


thr 


241/81 








atg ttc 


ggt 


ggt 


gtg 


met phe 


gly 


gly 


val 


301/101 








ggc gga 


teg 


get 


get 


gly gly 


ser 


ala 


ala 


361/121 








acc age 


cgt 


atg 


gaa 


thr ser 


arg 


met 


glu 



cat 
his 


gag 
glu 


cag 
gin 


egg 
arg 


atg 
met 


gca 
ala 


teg 
ser 


agt 
ser 


gtc 
val 


cgt 
arg 


gcg 

ala 


gcg 
ala 


ttg 
leu 


ttc 
phe 


ate 
ile 


atg 
met 


ate 
ile 


gga 
gly 


agt 
ser 


ttc 
phe 


gtg 
val 


tat 
tyr 


gee 
ala 


ate 
ile 


acc 
thr 


ggg 

gly 


get 
ala 


teg 
ser 


cgc 
arg 


cag 
gin 


gat 
asp 


egg 
arg 


ttc 
phe 


egg 
arg 


cgc 
arg 



31/11 








ctt gac 
leu asp 
91/31 


cag 
gin 


ate 
ile 


gag 
glu 


ggc ggg 
gly gly 
151/51 


ggc 
gly 


ttc 
phe 


cgc 
arcr 


ate ggt 
ile gly 
211/71 


ctg 
leu 


ggg 

gly 


atg 
met 


ccg ata 
pro ile 
271/91 


etc 
leu 


age 
ser 


gtt 
val 


ggt cct 
gly pro 
331/111 


egg 
arg 


ttg 
leu 


tec 
ser 


cgt cgt 
arg arg 
391/131 


acc 
thr 


aag 
lys 


ggg 

gly 


cgc ttc 
arg phe 


gac 
asp 


gag 
glu 


taa 
OCH 



age get etc tac gee 
ser ala leu tyr ala 

gca ccg acc gcg egg 
ala pro thr ala arg 

ttg gtt tec ggc gtg 
leu val ser gly val 

ttc ggt ttt gtc gtg 
phe gly phe val val 

ggc agg atg gat cgt 
gly arg met asp arg 

gee ggg ggc tea ttc 
ala gly gly ser phe 



SEQ ID N° 35D 



FIGURE 35D 



ORF d'apres 


Cole et 


al. 


(Nature 


393:537- 


1/1 


















tga cag 


tct 


gtc 


ggc 


aag 


gag 


gga 


cgc 


atg 


OPA gin 
61/21 


ser 


val 


gly 


lys 


glu 


gly 


arg 


met 


gac cag 


ate 


gag 


age 


get 


etc 


tac 


gee 


gaa 


asp gin 


ile 


glu 


ser 


ala 


leu 


tyr 


ala 


glu 


121/41 














ggg gg C 


ttc 


cgc 


gca 


ccg 


acc 


gcg 


egg 


egg 


gly gly 


phe 


arg 


ala 


pro 


thr 


ala 


arg 


arg 


181/61 














ggt ctg 


ggg 


atg 


ttg 


gtt 


tec 


ggc 


gtg 


gcg 


gly leu 


gly 


met 


leu 


val 


ser 


gly 


val 


ala 


241/81 
















ata etc 


age 


gtt 


ttc 


ggt 


ttt 


gtc 


gtg 


atg 


ile leu 


ser 


val 


phe 


gly 


phe 


val 


val 


met 


301/101 














cct egg 


ttg 


tec 


ggc 


agg 


atg 


gat 


cgt 


ggc 


pro arg 


leu 


ser 


gly 


arg 


met 


asp 


arg 


gly 


361/121 














cgt acc 


aag 


ggg 


gee 


ggg 


ggc 


tea 


ttc 


acc 


arg thr 


lys 


gly 


ala 


gly 


gly 


ser 


phe 


thr 


421/141 
















ttc gac 


gag 


taa 














phe asp 


glu 


OCH 















544) et contennant Rv2169c 



31/11 


















cca etc 
pro leu 
91/31 


tec 
ser 


gat 
asp 


cat 
his 


gag 
glu 


cag 
gin 


egg 
arg 


atg 
met 


ctt 
leu 


gat ccc 
asp pro 
151/51 


aag 
lys 


ttc 
phe 


gca 
ala 


teg 
ser 


agt 
ser 


gtc 
val 


cgt 
arg 


ggc 
gly 


cgc ctg 
arg leu 
211/71 


cag 
gin 


ggc 
gly 


gcg 

ala 


gcg 
ala 


ttg 
leu 


ttc 
phe 


ate 
ile 


ate 

ile 


ttc aaa 
phe lys 
271/91 


gag 
glu 


acc 
thr 


atg 
met 


ate 
ile 


gga 
gly 


agt 
ser 


ttc 
phe 


ccg 
pro 


ttc ggt 
phe gly 
331/111 


ggt 
gly 


gtg 
val 


gtg 
val 


tat 
tyr 


gee 
ala 


ate 
ile 


acc 
thr 


ggt 
gly 


gga teg 
gly ser 
391/131 


get 
ala 


get 
ala 


ggg 

gly 


get 
ala 


teg 
ser 


cgc 
arg 


cag 
gin 


cgt 
arg 


age cgt 
ser arg 


atg 
met 


gaa 
glu 


gat 
asp 


egg 
arg 


ttc 
phe 


egg 
arg 


cgc 
arg 


cgc 
arg 



SEQ ID 35F 
FEUILLE DE RENyP ] [ T ^g«IE^|, (REGLE 26) 



WO 99/09186 




•CT/FR98/018U 



109/185 



1/1 

GAC CTG GGA CGA AGA CGA CGG 
asp leu gly arg arg arg arg 
61/21 

CAA TGG ACA CCC GAC TAC GGT 
gin trp thr pro asp tyr gly 
121/41 

GTG GTC GGA GTG CCA CCC GAC 
val val gly val pro pro asp 
181/61 

ACG GCG CCG GTC TGG ATC ACC 
thr ala pro val trp ile thr 
241/81 

GGG GCA CCC GGT GGC ACC GTT 
gly ala pro gly gly thr val 
301/101 

GCC AAC GGC GGC CGG CTG GAC 
ala asn gly gly arg leu asp 
361/121 

GTC GAC CCC GAC GGC GCC GTC 
val asp pro asp gly ala val 









31/11 




CAG 


CAG 


CCG 


CAA TCA 


GAT 


gin 


gin pro 


gin ser 


asp 








91/31 


GCG 


CCT 


GCG 


CGG CTC 


GAC 


ala 


pro 


ala 


arg leu 


asp 








151/51 




CAG 


GCC 


ACC 


GAC TTC 


GGC 


gin 


ala 


thr 


asp phe 


gly 








211/71 


ATG 


CTG 


TGG 


CCG CTG 


GCC 


met 


leu trp 


pro leu 


ala 








271/91 




CCC 


GTC 


CGG 


CTG GTC 


GAC 


pro 


val 


arg 


leu val 


asp 








331/111 




ATC 


CTC 


CTG 


TCG GCG 


GCC 


ile 


leu 


leu 


ser ala 


ala 








391/131 




GGC 


CGA 


GCG 


CTG TGC 


CTG 


gly 


arg 


ala 


leu cys 


leu 



SEQ ID N° 36A 
FIGURE 36A 



CTA CCC 
leu pro 


GGT 
gly 


CCT 
pro 


GGT 
gly 


CAA 
gin 


CGT 
arg 


AAT 
asn 


GCG 
ala 


CGG 
arg 


TTC 
phe 


CTG 
leu 


TTG 
leu 


CCC 
Dro 


TCC 
ser 


GCT 
ala 


GTT 
val 


GCA 
ala 


CCA 
pro 


GAA 

glu 


ACG 
thr 


GAC 
asp 


CGG 
arg 


CCC 
pro 


CGG 
arg 


TTG 
leu 


GCC 
ala 


CCC 
pro 


GAC 
asp 


GAC 
asp 


CTG 
leu 


GCA 
ala 


AAC 
asn 


TCG 
ser 


CTG 
leu 


GAG TTC 
glu phe 


GCC 
ala 


ACC 
thr 


AAC 
asn 


CGG 
arg 


GAA 
glu 


GCC ATC 
ala ile 


GAC 
asp 


CCA 
pro 


GAT 
asp 


C 





1/1 

ACC TGG GAC GAA GAC 
thr trp asp glu asp 
61/21 

AAT GGA CAC CCG ACT 
asn gly his pro thr 
121/41 

TGG TCG GAG TGC CAC 
trp ser glu cys his 
181/61 

CGG CGC CGG TCT GGA 
arg arg arg ser gly 
241/81 

GGG CAC CCG GTG GCA 
gly his pro val ala 
301/101 

CCA ACG GCG GCC GGC 
pro thr ala ala gly 
361/121 

TCG ACC CCG ACG GCG 
ser thr pro thr ala 



GAC GGC 


AGC 


AGC 


CGC 


asp gly 


ser 


ser 


arg 


ACG GTG 


CGC 


CTG 


CGC 


thr val 


arg 


leu 


arg 


CCG ACC AGG 


CCA 


CCG 


pro thr 


arg 


pro 


pro 


TCA CCA 


TGC 


TGT 


GGC 


ser pro 


cys 


cys 


gly 


CCG TTC 


CCG 


TCC 


GGC 


pro phe pro 


ser 


gly 


TGG ACA TCC 


TCC 


TGT 


trp thr 


ser 


ser 


cys 


CCG TCG 


GCC 


GAG 


CGC 


pro ser 


ala 


glu 


arg 



31/11 

AAT CAG ATC TAC CCG 
asn gin ile tyr pro 
91/31 

GGC TCG ACA ATG CGC 
gly ser thr met arg 
151/51 

ACT TCG GCT CCG CTG 
thr ser ala pro leu 
211/71 

CGC TGG CCG ACC GGC 
arg trp pro thr gly 
271/91 

TGG TCG ACG ACG ACC 
trp ser thr thr thr 
331/111 

CGG CGG CCG AGT TCG 
arg arg pro ser ser 
391/131 

TGT GCC TGG CCA TCG 
cys ala trp pro ser 



GTC 


CTG 


GTC 


AAC 


GTC 


val 


leu 


val 


asn 


val 


GGT 


TCC 


TGT 


TGC 


CCG 


gly 


ser 


cys 


cys 


pro 


TTG 


CAC 


CAG 


AAA 


CGA 


leu 


his 


gin 


lys 


arg 


CCC 


GGT 


TGG 


CCC 


CCG 


pro 


gly 


trp 


pro 


pro 


TGG 


CAA 


ACT 


CGC 


TGG 


trp 


gin 


thr 


arg 


trp 


CCA 


CCA 


ACC 


GGG 


AAG 


pro 


pro 


thr 


gly 


iys 


ACC 


CAG 


ATC 






thr 


gin 


ile 







SEQ ID N° 36B 



FEUILLE DE REIttKM«E¥P(REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



110/185 



1/1 31/11 



CCT GGG 


ACG 


AAG ACG 


ACG 


GCA 


GCA 


GCC 


GCA 


ATC AGA TCT ACC 


CGG 








ACG 


TCA 


pro gly 


thr 


lys thr 


thr 


ala 


ala 


ala 


ala 


ile arg ser 


thr 


arg 


ser 


trp 


ser 


thr 


ser 


61/21 


















91/31 










ATG GAC 


ACC 


CGA 


CTA 


CGG 


TGC 


GCC 


TGC 


GCG 


GCT CGA CAA 


TGC 


GCG 




UL. 1 


GTT 


GCC 


CGT 


met asp 


thr 


arg 


leu 


arg 


cys 


ala 


cys 


ala 


ala arg gin 


cys 


ala 


val 


oro 


val 


ala 


arg 


121/41 


















151/51 












GGT CGG 


AGT 


GCC 


ACC 


CGA 


CCA 


GGC 


CAC 


CGA 


CTT CGG CTC 


CGC 


TGT 


TGC 


ACC 


AGA 


AAC 


GAC 


gly arg 


ser 


ala 


thr 


arg pro 


gly his 


arg 


leu arg leu 


arg 


cys 


cys 


thr 


arg 


asn 


asp 


181/61 


















211/71 










GGC GCC 


GGT 


CTG 


GAT 


CAC 


CAT 


GCT 


GTG 


GCC 


GCT GGC CGA 


CCG 


GCC 


CCG 


GTT 


GGC 


CCC 


CGG 


gly ala 


gly 


leu 


asp 


his 


his 


ala 


val 


ala 


ala gly arg pro ala 


pro 


val 


gly 


pro 


arg 


241/81 


















271/91 










GGC ACC 


CGG 


TGG 


CAC 


CGT 


TCC 


CGT 


CCG 


GCT 


GGT CGA CGA 


CGA 


CCT 


GGC 


AAA 


CTC 


GCT 


GGC 


gly thr 


arg 


trp 


his 


arg 


ser 


arg 


pro 


ala 


gly arg arg 


arg 


pro 


gly 


lys 


leu 


ala 


gly 


301/101 


















331/111 










CAA CGG 


CGG 


CCG 


GCT 


GGA 


CAT 


CCT 


CCT 


GTC 


GGC GGC CGA 


GTT 


CGC 


CAC 


CAA 


CCG 


GGA AGT 


gin arg 


arg 


pro 


ala 


gly his 


pro 


pro 


val 


gly gly arg 


val 


arg 


his 


gin 


pro 


gly 


ser 


361/121 


















391/131 










CGA CCC 


CGA 


CGG 


CGC 


CGT 


CGG 


CCG 


AGC 


GCT 


GTG CCT GGC 


CAT 


CGA 


CCC 


AGA 


TC 






arg pro 


arg 


arg 


arg 


arg 


arg 


pro 


ser 


ala 


val pro gly his arg 


pro 


arg 









SEQ ID N° 36 C 
FIGURE 36C 



Sequence codante Rv3909 predite par 
con tenant Seq 36A 

1/1 



GTG ACC 


GCA 


CTG 


CAA 


CTC 


GGC 


TGG GCC 


GCT 


met thr 


ala 


leu 


gin 


leu 


gly 


trp ala 


ala 


61/21 












GTG GCC 


GGC 


CTC 


GGG 


ATG 


GCG 


CTC ACG 


GTA 


val ala 


gly 


leu 


gly 


met 


ala 


leu thr 


val 


121/41 














GAG CCC 


AGC 


CCG 


ACG 


CCT 


TTT 


GTC CAG 


GTC 


glu pro 


ser 


pro 


thr 


pro 


phe 


val gin 


val 


181/61 














ACC ACT 


TCC 


AGC 


GAA 


CCC 


CAT 


GTC ACC 


GTC 


thr thr 


ser 


ser 


glu 


pro 


his 


val thr 


val 


241/81 












CCA GTC 


CGC 


GAT 


GTG 


ATG 


GTC 


CGG CTT 


GAG 


pro val 


arg 


asp 


val 


met 


val 


arg leu 


glu 


301/101 














TTA CGC 


ACC 


TCG 


CTC 


GAC 


GGC 


GGC ACC 


GAC 


leu arg 


thr 


ser 


leu 


asp 


gly 


gly thr 


asp 



ole et 


al . , 


19 


98 


(Nature 


393 


537 


-544 


31/11 


















TTG GCG 


CGC 


GTC 


ACC 


TCA 


GCG 


ATC 


GGC 


GTC 


leu ala 


arg 


val 


thr 


ser 


ala 


ile 


gly val 


91/31 


















CCG TCG 


GCG 


GCA 


CCG 


CAC 


GCG 


CTC 


GCA 


GGC 


pro ser 


ala 


ala 


pro 


his 


ala 


leu 


ala 


gly 


151/51 
















CGC ATC 


GAT 


CAG 


GTG 


ACC 


CCG 


GAC 


GTG 


GTG 


arg ile 


asp 


gin val 


thr 


pro 


asp 


val 


val 


211/71 














AGC GGA 


ACG 


GTG ACC 


AAT 


ACC 


GGT 


GAC 


CGC 


ser gly 


thr 


val 


thr 


asn 


thr 


gly 


asp 


arg 


271/91 












CAC GCC 


GCC 


GCG 


GTC 


ACG 


TCG 


TCA 


ACG 


GCG 


his ala 


ala 


ala 


val 


thr 


ser 


ser 


thr 


ala 


331/111 


















CAG TAC 


CAG 


CCG 


GCC 


GCG 


GAC 


TTC 


CTC 


ACG 


gin tyr 


gin 


pro 


ala 


ala 


asp 


phe 


leu 


thr 



SEQ ID N° 36D 



FIGURE 36D 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 




'CT/FR98/01813 



111/185 



361/121 








GTC GCC 


CCC 


GAA 


CTA 


val ala 


pro 


glu 


leu 


421/141 








TCG CTG 


ACC 


AGG 


CCG 


ser leu 


thr 


arg 


pro 


481/161 








GTC AAT 


GGG 


ACA 


CCC 


val asn 


gly 


thr 


pro 


541/181 








CCC GTG 


GTC 


GGA 


GTG 


pro val 


val 


gly 


val 


601/201 








ACG ACG 


GCG 


CCG 


GTC 


thr thr 


ala 


pro 


val 


661/221 








CCC GGG 


GCA 


CCC 


GGT 


pro gly 


ala 


pro 


gly 


721/241 








CTG GCC 


AAC 


GGC 


GGC 


leu ala 


asn 


gly 


g!y 


781/261 








GAA GTC 


GAC 


CCC 


GAC 


glu val 


asp 


pro 


asp 


841/281 








CTC ATC 


ACC 


GTC 


AAT 


leu ile 


thr 


val 


asn 


901/301 








GCT CAA 


CTA 


CCG 


GGC 


ala gin 


leu 


pro 


gly 


961/321 








CTG GAT 


CGA 


TTG 


CGG 


leu asp 


arg 


leu 


arg 


1021/341 






GCC GAC 


CTG 


GAT 


GCT 


ala asp 


leu 


asp 


ala 


1081/361 






AGC CCC 


GCC 


GAC 


ATC 


ser pro 


ala 


asp 


ile 


1141/381 






CTG CCC 


GAC 


GGC 


CCG 


leu pro 


asp 


gly 


pro 


1201/401 






GTT GCC 


GTC 


GCG 


GCC 


val ala 


val 


ala 


ala 


1261/421 






TCC GCG 


CTC 


TTA 


CCC 


ser ala 


leu 


leu 


pro 


1321/441 




TTT GAT 


CCC 


GCG 


GTC 


phe asp 


pro 


ala 


val 


1381/461 






TAT CTA 


GAT 


CCC 


TCG 


tyr leu 


asp 


pro 


ser 



GAC 
asp 


CGC 
arg 


GGG 
gly 


CAA 
gin 


GAG 
glu 


TCG 
ser 


TTG 
leu 


GCC 
ala 


GTC 
val 


AAC 
asn 


GAC 
asp 


TAC 
tyr 


GGT 
gly 


GCG 
ala 


CCT 
pro 


CCA 
pro 


CCC 
pro 


GAC 
asp 


CAG 
gin 


GCC 
ala 


TGG 
trp 


ATC 
ile 


ACC 
thr 


ATG 
met 


CTG 
leu 


GGC 
gly 


ACC 
thr 


GTT 
val 


CCC 
pro 


GTC 
val 


CGG 
arg 


CTG 
leu 


GAC 
asp 


ATC 
ile 


CTC 
leu 


GGC 
gly 


GCC 
ala 


GTC 
val 


GGC 
gly 


CGA 
arg 


GCG 
ala 


ATG 
met 


ACC 
thr 


GGC 
gly 


GGC 
gly 


ACC 
thr 


CCG 
pro 


ACC 
thr 


CAC 
his 


CCG 
pro 


ACG 
thr 


CTA 
leu 


GTC 
val 


CAC 
his 


CGG 
arg 


TTG 
leu 


CAG 
gin 


CGG 
arg 


GTT 
val 


AAT 
asn 


GTC 
val 


GAC 
asp 


CGC 
arg 


ATC 
ile 


CTG 
leu 


TTG 
leu 


ACC 
thr 


GGC 
gly 


CGG 
arg 


GCG 
ala 


GCC 
ala 


GAT 
asp 


TTT 
phe 


AGC 
ser 


CCC 
pro 


GCT 
ala 


ACC 
thr 


GCG 
ala 


CCC 
pro 


CGG 
arg 


GGG 

gly 


GCC 
ala 


GCG 
ala 


CTG 
leu 


GCC 
ala 


TTG 
leu 


TTC 
phe 


GTT 
val 


CGG 
arg 


ATC 
ile 



391/131 

GCC GGC TTT ACC CTC 
ala gly phe thr leu 
451/151 

CAG CCC GGG ATC TAG 
gin pro gly ile tyr 
511/171 

GCG CGG CTC GAC AAT 
ala arg leu asp asn 
571/191 

ACC GAC TTC GGC TCC 
thr asp phe gly ser 
631/211 

TGG CCG CTG GCC GAC 
trp pro leu ala asp 
691/231 

CGG CTG GTC GAC GAC 
arg leu val asp asp 
751/251 

CTG TCG GCG GCC GAG 
leu ser ala ala glu 
811/271 

GCG CTG TGC CTG GCC 
ala leu cys leu ala 
871/291 

TAC GTC GTG TCC GAC 
tyr val val ser asp 
931/311 

GGC ACC GGC CAG GCC 
gly thr gly gin ala 
991/331 

ACA TGC GTG ACG CCG 
thr cys val thr pro 
1051/351 

GAT CCG AGG CTG AGC 
asp pro arg leu ser 
1111/371 

GAT GTC AGC TCC ACC 
asp val ser ser thr 
1171/391 

ATC AAC TTG CTC AGC 
ile asn leu leu ser 
1231/411 

GAG GAA CAG CAG GGT 
glu glu gin gin gly 
1291/431 

CGG TTG TCC CCG CGG 
arg leu ser pro arg 
1351/451 

GCC GCG GGA ACA AAC 
ala ala gly thr asn 
1411/471 

GCG CAT GAA TCG ATC 
ala his glu ser ile 



TCG 
ser 


GCC 
ala 


CCG 
pro 


CTG 
leu 


CGC 
arg 


CCG 
pro 


GTC 
val 


CTG 
leu 


GTC 
val 


AAC 
asn 


GCG 
ala 


CGG 
arg 


TTC 
phe 


CTG 
leu 


TTG 
leu 


GCT 
ala 


GTT 
val 


GCA 
ala 


CCA 
pro 


GAA 
glu 


CGG 
arg 


CCC 
pro 


CGG 
arg 


TTG 
leu 


GCC 
ala 


GAC 
asp 


CTG 
leu 


GCA 
ala 


AAC 
asn 


TCG 
ser 


TTC 
phe 


GCC 
ala 


ACC 
thr 


AAC 
asn 


CGG 
arg 


ATC 
ile 


GAC 
asp 


CCA 
pro 


GAT 
asp 


CTA 
leu 


TCG 
ser 


CCC 
pro 


GAC 
asp 


GGG 
gly 


GCC 
ala 


GCC 
ala 


GCA 
ala 


TCC 
ser 


AGC 

ser 


TGG 
trp 


CTG 
leu 


CCT 
pro 


TTT 
phe 


GCC 
ala 


CAA 
gin 


GCG 
ala 


ATC 
ile 


GCA 
ala 


ACC 
thr 


ATC 
ile 


CGC 
arg 


GGC 
gly 


GCA 
ala 


ACC 
thr 


GTG 
val 


ACC 
thr 


CAC 
his 


GGC 
gly 


AAC 
asn 


ACG 
thr 


TCG 
ser 


TCC 
ser 


CAG 
gin 


ATC 
ile 


GGC 
gly 


GTG 
val 


GTA 
val 


GCG 
ala 


GCG 
ala 


CCG 
pro 


CCG 
pro 


ACC 
thr 


GTT 
val 


CCT 
pro 


ACC 
thr 


ACC 
thr 


GCG 
ala 


CGC 
arg 


CGC 
arg 


CAG 
gin 



SEQ ID N° 36D (suite 1) 
FEUILLE D^f?eBPLA©fe!Vlfe^(Re3CLE 26) 



WO 99/09186 




CT/FR98/01813 



112/185 



1441/481 

GAC GCC TTG GGC GCA 
asp ala leu gly ala 
1501/501 

ATC CTG GTG CCG CCG 
ile leu val pro pro 
1561/521 

GCG CTG GCC ACC GCC 
ala leu ala thr ala 
1621/541 

GCT GAC GCC GCG GCC 
ala asp ala ala ala 
1681/561 

GGC CGG TTC AAT GAC 
gly arg phe asn asp 
1741/581 

CTG ACC TCG GCG TTG 
leu thr ser ala leu 
1801/601 

CCA CTA CGC GAG GAC 
pro leu arg glu asp 
1861/621 

GGG CTG GCC CAG CAG 
gly leu ala gin gin 
1921/641 

GTG ACC ATC GTC AAC 
val thr ile val asn 
1981/661 

TTG GCG CTG CAT AAT 
leu ala leu his asn 
2041/6B1 

CCC GGG ATG ACG GTG 
pro gly met thr val 
2101/701 

CGA GTA CCA ATC GAG 
arg val pro ile glu 
2161/721 

CCC GAC GGC GTC GCG 
pro asp gly val ala 
2221/741 

AAG GTG TTG TTC GCG 
lys val leu Dhe ala 
2281/761 

CGC CTT TGG CAC CGG 
arg leu trp his arg 
2341/781 

CCT ACC GGC AAA CAC 
pro thr gly lys his 
2401/801 
CGG GTA TGA 
arg val OP A 



ATG 
met 


CTG 
leu 


TGG 
trp 


CGC 
arg 


AGC 
ser 


GCG 
ala 


TCG 
ser 


TGG 
trp 


AGC 
ser 


CTG 
leu 


ATC 
ile 


CGG 
arg 


TCT 
ser 


GGC 
gly 


CTG 
leu 


CGC 
arg 


ACC 
thr 


GAG 

glu 


CCA 
pro 


CCG 
pro 


GAC 
asp 


ATC 
ile 


ACC 
thr 


ACG 
thr 


CAG 

gin 


ACC 
thr 


ATC 
ile 


GAT 
asp 


GAC 
asp 


CGC 
arg 


ATG 
met 


TTG 
leu 


CGC 
arg 


GCG 
ala 


CTG 
leu 


CGG 
arg 


CTG 
leu 


GCC 
ala 


GTC 
val 


GTT 
val 


CCG 
pro 


GGC 
gly 


GGC 
gly 


TCC 
ser 


TAC 
tyr 


GGC 
gly 


CTC 
leu 


GCC 
ala 


GTG 
val 


CCA 
pro 


GCC 
ala 


GAT 
asp 


GTC 
val 


GGT 
ft! if 


CAG 

y Ail 


GTG 
val 


AAC 
asn 


TTC 
phe 


ACA 
thr 


CAG 
gin 


CTG 
leu 


GGT 
gly 


GAA 
glu 


CCG 
pro 


GTG 
val 


ATC 
ile 


ACG 
thr 


CTA 
leu 


TCC 
ser 


GCT 
ala 


TTC 
phe 


CGT 
arg 


GGC 
gly 


CAG 
gin 


CCT 
pro 


GCC 
ala 


CCG 
pro 


CAG 
gin 


CGC 
arg 


CGT 
arg 



1471/491 

TTG GAG CCG AAT GCC 
leu glu pro asn ala 
1531/511 

GCC AGC GAC GAC GCG 
ala ser asp asp ala 
1591/531 

GCC GTG CCG CGA CCA 
ala val pro arg pro 
1651/551 

GAA CCC CCG GGC GCT 
glu pro pro gly ala 
1711/571 

ATC GGC GGG CAG GTT 
ile gly gly gin val 
1771/591 

ACC GGG CTG ACC GGC 
thr gly leu thr gly 
1831/611 

AGC CAA TCG CTA CCA 
ser gin ser leu pro 
1891/631 

GGA AAG ACG ATC GAC 
gly lys thr ile asp 
1951/651 

ACT CTG GCC ACC GAG 
thr leu ala thr glu 
2011/671 

ATC CGG GTC CGG CTA 
ile arg val arg leu 
2071/691 

ATC GAG CTA CCG CCC 
ile glu leu pro pro 
2131/711 

CGG- GTT GCC GTC GAC 
arg val ala val asp 
2191/731 

CGG TTG TCG GTG CAC 
arg leu ser val his 
2251/751 

GCG GCC GTG CTG GTA 
ala ala val leu val 
2311/771 

GAT CGC GCC GAC CTG 
asp arg ala asp leu 
2371/791 

GCC GTA GCC AGT CGG 
ala val ala ser arg 



GCG 
ala 


CCC 
pro 


CGT 
arg 


ACC 
thr 


CAA 
cln 


CAG 
gin 


GTC 
val 


ATC 
ile 


CTG 
leu 


ACC 
thr 


CTA 
leu 


CCG 
pro 


GCG 
ala 


GTG 
val 


ATC 
ile 


TAC 
tyr 


AGC 
ser 


GCC 
ala 


GCT 
ala 


CGC 
arg 


GCC 
ala 


CGG 
arg 


CTA 
leu 


TGG 
trp 


AAG 

lys 


GTG 
val 


CAG 
gin 


TAC 
tyr 


ACC 
thr 


GCA 
ala 


CCC 
pro 


GAT 
asp 


ACC 
thr 


CGC 
arg 


AAC 
asn 


GAT 
asp 


CTT 
leu 


TTC 
phe 


GGC 
gly 


GCG 
ala 


CAC 
his 


AGT 
ser 


CCG 
pro 


CTG 
leu 


CCG 
pro 


CAG 
gin 


GTC 
val 


GAT 
asp 


GCT 
ala 


CCG 
pro 


GGG 
gly 


TAC 
tyr 


CTG 

1 All 

leu 


CCG 
pro 


CTA 
leu 


GTG 
val 


TCG 
ser 


CTG 
leu 


CGG 
arg 


ACC 
thr 


TCC 
ser 


AAC 
asn 


GCC 
ala 


TAC 
tyr 


GGC 
gly 


ACG 
thr 


CTG 
leu 


GCG 
ala 


GGC 
gly 


CGG 
arg 


GAT 
asp 


CGC 
arg 


CCC 
pro 


GAC 
asp 


CTG 
leu 


GAT 
asp 


GAC 
asp 


GAA 
glu 


AAG 
lys 


CAC 
his 



SEQ ID N° 36D (suite 2) 

FIGURE 36D (suite 2) 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 




•CT/FR98/01813 



113/185 



ORF d'apres Cole et al., 1998 (Nature 



1/1 



TGA CTC 


AGC 


ACC 


GGG TCA GCA CAA 


CGG 


TCC 


OPA leu 


ser 


thr 


gly ser ala gin 


ara 


ser 


61/21 












GGC TGG 


GCC 


GCT 


TTG 


GCG CGC GTC 


ACC 


TCA 


gly trp 


ala 


ala 


leu 


ala arg val 


thr 


ser 


121/41 












GCG CTC 


ACG 


GTA 


CCG 


TCG GCG GCA 


CCG 


CAC 


ala leu 


thr 


val 


pro 


ser ala ala 


oro 


his 


181/61 












TTT GTC 


CAG 


GTC 


CGC 


ATC GAT CAG 


GTG 


acc 


phe val 
241/81 


gin 


val 


arg 


ile asp gin 


val 


thr 


CAT GTC 


ACC 


GTC 


AGC 


GGA ACG GTG 


ACC 


AAT 


his val 


thr 


val 


ser 


gly thr val 


thr 


asn 


301/101 












GTC CGG 


CTT 


GAG 


CAC 


GCC GCC GCG 


GTC 


ACG 


val arg 


leu 


glu 


his 


ala ala ala 


val 


thr 


361/121 














GGC GGC 


ACC 


GAC 


CAG 


TAC CAG CCG 


GCC 


GCG 


gly gly 


thr 


asp 


gin tyr gin pro 


ala 


ala 


421/141 














CGC GGG 


CAA 


GAG 


GCC 


GGC TTT ACC 


CTC 




arg gly 


gin 


glu 


ala 


gly phe thr 


leu 


ser 


481/161 














TTG GCC 


GTC 


AAC 


CAG 


CCC GGG ATC 


TAC 


CCG 


leu ala 


val 


asn 


gin pro gly ile 


tyr 


oro 


541/181 










TAC GGT 


GCG 


CCT 


GCG 


CGG CTC GAC 


AAT 


GCG 


tyr gly 


ala 


pro 


ala 


arg leu asp 


asn 


ala 


601/201 












CCC GAC 


CAG 


GCC 


ACC 


GAC TTC GGC 


TCC 


GCT 


pro asp 


gin 


ala 


thr asp phe gly 


ser 


ala 


661/221 














ATC ACC 


ATG 


CTG 


TGG 


CCG CTG GCC 


GAC 


CGG 


ile thr 


met 


leu 


trp pro leu ala 


asp 


arg 


721/241 










ACC GTT 


CCC 


GTC 


CGG 


CTG GTC GAC 


GAC 


GAC 


thr val 


pro 


val 


arg 


leu val asp 


asp 


asp 


781/261 










CTG GAC 


ATC 


CTC 


CTG 


TCG GCG GCC 


GAG 


TTC 


leu asp 


ile 


leu 


leu 


ser ala ala 


glu 


phe 


841/281 










GCC GTC 


GGC 


CGA 


GCG 


CTG TGC CTG 


GCC 


ATC 


ala val 


gly 


arg 


ala 


leu cys leu 


ala 


ile 


901/301 












ATG ACC 


GGC 


GGC 


TAC 


GTC GTG TCC 


GAC 


TCG 


met thr 


gly 


gly 


tyr 


val val ser 


asp 


ser 


961/321 












CCG ACC 


CAC 


CCG 


GGC 


ACC GGC CAG 


GCC 


GCC 


pro thr 


his 


pro 


gly thr gly gin 


ala 


ala 



537-54 4) et contenant Rv 3909. 



31/11 


















CGG GCC 


GGG 


GCC 


GTG 




OLA 






CTC 


arg ala 


a 1 \/ 
y ±y 


aid 


Vol 


cnr 


aia 


1 cm 

leu 


gin 


leu 


91/31 
















GCG ATC 


GGC 


GTC 


GTG 


GCC 


GGC 


CTC 




ATG 


ala ile 




val 


1/-, i 


ala 


gly 


leu 


gly 


met 


151/51 














GCG CTC 


GCA 


GGC 


GAG 


CCC 




CCG 


ACG 


CCT 


ala leu 


ala 


giy 


glu 


pro 


ser 


pro 


thr 


pro 


211/71 














CCG GAC 


GTG 


GTG 


ACC 


ACT 


TCC 


AGC 


GAA 


CCC 




val 


vdi 


cnr 


tnr 


ser 


ser 


glu 


pro 


271/91 














ACC GGT 


GAC 


CGC 


CCA 


GTC 




GAT 




ATG 


thr c| 1 y 


asp 


arg 


pro 


val 


arg 


asp 


val 


met 


331/111 














TCG TCA 


ACG 


GCG 


TTA 


CGC 


ACC 


TCG 


err 


GAC 


ser ser 


thr 


ala 

old 


1 f=>w 
x eu 


arg 


tnr 


ser 


leu 


asp 


391/131 
















GAC TTC 


CTC 


ACG 


GTC 


GCC 


CCC 


GAA 


CTA 


GAC 


*-* *■* f!4IC 


leu 


t-hr 




aia 


pro 


glu 


leu 


asp 


451/151 












GCC CCG 


CTG 


CGC 


TCG 


CTG 


ACC 


AGG 


CCG 


TCG 


ala p ro 




arg 


ser 


leu 


cnr 


arg 


pro 


ser 


511/171 














GTC CTG 


GTC 


AAC 


GTC 


AAT 


GGG 




CCC 


GAC 


val leu 


val 


asn 


va 1 
v a x. 


asn 


giy 


cnr 


pro 


asp 


571/191 














CGG TTC 


CTG 


TTG 


CCC 


GTG 


GTC 


GGA 




CCA 


arg one 


leu 


leu 


d ro 


va JL 


vai 


giy 


val 


pro 


631/211 














GTT GCA 


CCA 


GAA 


ACG 


ACG 


GCG 


CCG 


GTC 




val ala 


p ro 


Cf 1 u 




L ILL. 


aia 


pro 


val 


trp 


691/231 














CCC CGG 


TTG 


GCC 


CCC 


GGG 


GCA 


CCC 


GGT 


GGC 


pro arg 


leu 


ala 


pro 


gly 


ala 


pro 


gly 


gly 


751/251 














CTG GCA 


AAC 


TCG 


CTG 


GCC 


AAC 


GGC 


GGC 


CGG 


leu ala 


asn 


ser 


leu 


ala 


asn 


giy 


gly 


arg 


811/271 














GCC ACC 


AAC 


CGG 


GAA 


GTC 


GAC 


CCC 


GAC 


GGC 


ala thr 


asn 


arg 


glu 


val 


asp 


pro 


asp 


gly 


871/291 














GAC CCA 


GAT 


CTA 


CTC 


ATC 


ACC 


GTC 


AAT 


GCG 


asp pro 


asp 


leu 


leu 


ile 


thr 


val 


asn 


ala 


931/311 
















CCC GAC 


GGG 


GCC 


GCT 


CAA 


CTA 


CCG 


GGC 


ACC 


pro asp 


gly 


ala 


ala 


gin 


leu 


pro 


gly 


thr 


991/331 














GCA TCC 


AGC 


TGG 


CTG 


GAT 


CGA 


TTG 


CGG 


ACG 


ala ser 


ser 


trp 


leu 


asp 


arg 


leu 


arg 


thr 



SEQ ID N° 36F 
FEUILLE DE REMPUWBBMe«F(REGLE 26) 



WO 99/09186 




CT/FR98/01813 



114/185 



1021/341 

CTA GTC CAC CGG ACA TGC GTG ACG CCG CTG 
leu val his arg thr cys val thr pro leu 
1081/361 

CAG CGG GTT AAT GAT CCG AGG CTG AGC GCG 
gin arg val asn asp pro arg leu ser ala 
1141/381 

GAC CGC ATC CTG GAT GTC AGC TCC ACC CGC 
asp arg ile leu asp val ser ser thr arg 
1201/401 

ACC GGC CGG GCG ATC AAC TTG CTC AGC ACC 
thr gly arg ala ile asn leu leu ser thr 
1261/421 

GAT TTT AGC CCC GAG GAA CAG CAG GGT TCG 
asp phe ser pro glu glu gin gin gly ser 
1321/441 

ACC GCG CCC CGG CGG TTG TCC CCG CGG GTG 
thr ala pro arg arg leu ser pro arg val 
1381/461 

GCC GCG CTG GCC GCC GCG GGA ACA AAC CCG 
ala ala leu ala ala ala gly thr asn pro 
1441/481 

TTC GTT CGG ATC GCG CAT GAA TCG ATC ACC 
phe val arg ile ala his glu ser ile thr 
1501/501 

CTG TGG CGC AGC TTG GAG CCG AAT GCC GCG 
leu trp arg ser leu glu pro asn ala ala 
1561/521 

TCG TGG AGC CTG GCC AGC GAC GAC GCG CAG 
ser trp ser leu ala ser asp asp ala gin 
1621/541 

CGG TCT GGC CTG GCC GTG CCG CGA CCA CTA 
arg ser gly leu ala val pro arg pro leu 
1681/561 

ACC GAG CCA CCG GAA CCC CCG GGC GCT TAC 
thr glu pro pro glu pro pro gly ala tvr 
1741/581 

ATC ACC ACG CAG ATC GGC GGG CAG GTT GCC 
ile thr thr gin ile gly gly gin val ala 
1801/601 

ATC GAT GAC CGC ACC GGG CTG ACC GGC GTG 
ile asp asp arg thr gly leu thr gly val 
1861/621 

TTG CGC GCG CTG AGC CAA TCG CTA CCA CCC 
leu arg ala leu ser gin ser leu pro oro 
1921/641 

CTG GCC GTC GTT GGA AAG ACG ATC GAC GAT 
leu ala val val gly lys thr ile asp aso 
1981/661 

GGC GGC TCC TAC ACT CTG GCC ACC GAG CAC 
gly gly ser tyr thr leu ala thr glu his 



1051/351 



CCT TTT GCC 


CAA 


GCC 






GAT 


GCT 


TTG 


pro phe ala gin ala 


asp 


leu 


asp 


ala 


leu 


1111/371 














ATC GCA ACC 


ATC 


AGC 


CCC 


GCC 


GAC 


ATC 


GTC 


ile ala thr 


ile 


ser 


pro 


ala 


asp 


ile 


val 


1171/391 














GGC GCA ACC 


GTG 


CTG 


CCC 


GAC 


GGC 


CCG 


TTG 


gly ala thr 


val 


leu 


pro 


asp 


gly 


pro 


leu 


1231/411 










CAC GGC AAC 


ACG 


GTT 


GCC 


GTC 


GCG 


GCC 


GCC 


his gly asn 


thr 


val 


ala 


val 


ala 


ala 


ala 


1291/431 
















TCC CAG ATC 


GGC 


TCC 


GCG 


CTC 


TTA 


CCC 


GCT 


ser gin ile 


gly 


ser 


ala 


leu 


leu 


pro 


ala 


1351/451 














GTA GCG GCG 


CCG 


TTT 


GAT 


CCC 


GCG 


GTC 


GGG 


val ala ala 


pro phe 


asp 


pro 


ala 


val 


gly 


1411/471 














ACC GTT CCT 


ACC TAT 


CTA 


GAT 


CCC 


TCG 


TTG 


thr val pro thr tyr 


leu 


asp 


pro 


ser 


leu 


1471/491 












GCG CGC CGC 


CAG 


GAC 


GCC 


TTG 


GGC 


GCA 


ATG 


ala arg arg gin 


asp 


ala 


leu 


gly 


ala 


met 


1531/511 














CCC CGT ACC 


CAA 


ATC 


Liu 




CCG 


GCG 


GCG 


pro arg thr gin ile 


leu 


val 


pro 


pro 


ala 


1591/531 












GTC ATC CTG 


ACC 


GCG 






AGC 


bLL 


ATC 


val ile leu 


thr 


ala 


leu 


oJLa 


rnr 


aia 


ile 


1651/551 
















CCG GCG GTG 


ATC 


GCT 




err 


GCG 


GCC 


CGC 


pro ala val 


ile 


ala 


asp 


» 1 a 

aia 


ala 


ala 


arg 


1711/571 














AGC GCC GCT 


CGC 


GGC 




J 1L 




GAC 


GAC 


ser ala ala 


arg gly 


arq 


phe 


asn 


aso 


asp 


1771/591 














CGG CTA TGG 


AAG 


CTG 


ACC 


TCG 


GCG 


TTG 


ACC 


arg leu trp 


lys 


leu 


thr 


ser 


ala 


leu 


thr 


1831/611 
















CAG TAC ACC 


GCA 


CCA 


CTA 


CGC 


GAG 


GAC 


ATG 


gin tyr thr 


ala 


pro 


leu 


arg 


glu 


asp 


met 


1891/631 










GAT ACC CGC 


AAC 


GGG 


CTG 


GCC 


CAG 


CAG 


CGG 


asp thr arg 


asn 


gly 


leu 


ala 


gin 


gin 


arg 


1951/651 














CTT TTC GGC 


GCG 


GTG 


ACC 


ATC 


GTC 


AAC 


CCG 


leu phe gly 


ala 


val 


thr 


ile 


val 


asn 


pro 


2011/671 














AGT CCG CTG 


CCG 


TTG 


GCG 


CTG 


CAT 


AVT 


GGC 


ser pro leu 


pro 


leu 


ala 


leu 


his 


asn 


gly 



SEQ ID 36F (suite 1) 
FIGURE 36F (suite 1) 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 




•CT/FR98/018I3 



115/185 



2041/681 2071/691 



CTC GCC GTG 


CCA ATC 


CGG 


GTC 


CGG 


CTA 


CAG 


GTC GAT GCT 


CCG 


CCC 


GGG 


ATG 


ACG 


GTG 


GCC 


leu ala val 


pro ile 


arg 


val 


arg 


leu gin 


val asp ala 


pro 


pro 


sly 


met 


thr 


val 


ala 


2101/701 














2131/711 










GAT GTC GGT 


CAG ATC 


GAG 


CTA 


CCG 


CCC 


GGG 


TAC CTG CCG 


CTA 


CGA 


GTA 


CCA 


ATC 


GAG 


GTG 


asp val gly 


gin ile 


glu leu 


pro 


pro gly 


tyr leu pro 


leu 


arg 


val 


pro 


ile 


glu 


val 


2161/721 














2191/731 










AAC TTC ACA 


CAG CGG 


GTT 


GCC 


GTC 


GAC 


GTG 


TCG CTG CGG 


ACC 


CCC 


GAC 


GGC 


GTC 


GCG 


CTG 


asn phe thr 


gin arg val ala val 


asp 


val 


ser leu arg 


thr 


pro 


asp 


gly 


val 


ala 


leu 


2221/741 














2251/751 










GGT GAA CCG 


GTG CGG 


TTG 


TCG 


GTG 


CAC 


TCC 


AAC GCC TAC 


GGC 


AAG 


GTG 


TTG 


TTC 


GCG 


ATC 


gly glu pro 


val arg 


leu 


ser 


val 


his 


ser 


asn ala tyr gly lys 


val 


leu 


phe 


ala 


ile 


2281/761 














2311/771 














ACG CTA TCC 


GCT GCG 


GCC 


GTG 


CTG 


GTA ACG 


CTG GCG GGC 


CGG 


CGC 


CTT 


TGG 


CAC 


CGG 


TTC 


thr leu ser 


ala ala 


ala 


val 


leu 


val 


thr 


leu ala gly 


arg 


arg 


leu 


trp 


his 


arg 


phe 


2341/781 














2371/791 








CGT GGC CAG 


CCT GAT 


CGC 


GCC 


GAC 


CTG 


GAT 


CGC CCC GAC 


CTG 


CCT 


ACC 


GGC 


AAA 


CAC 


GCC 


arg gly gin 


pro asp 


arg 


ala 


asp 


leu 


asp 


arg pro asp 


leu 


pro 


thr 


gly 


lys 


his 


ala 


2401/801 














2431/811 










CCG CAG CGC 


CGT GCC 


GTA 


GCC 


AGT 


CGG 


GAT 


GAC GAA AAG 


CAC 


CGG 


GTA 


TGA 








pro gin arg 


arg ala 


val 


ala 


ser 


arg 


asp 


asp glu lys 


his 


arg 


val 


OPA 









SEQ ID 36F (suite 2) 
FIGURE 36F (suite 2) 



1/1 

ATC CGC GCG TTG GCG TCG CAT 
ile arg ala leu ala ser his 
61/21 

CAC AGC GGC GCC CAA ATC ATG 
his ser gly ala gin ile met 
121/41 

CTC AAC CTG CCC TGG CTG GCC 
leu asn leu pro trp leu ala 
181/61 

GCA GCC GGG CAG CTT CGA GAG 

ala ala gly gin leu arg glu 

241/81 

CGC AAG ATC 

arg lys ile 









31/11 




CCG 


AAC 


ATC 


GTC GGA 


GTC 


pro 


asn 


ile 


val gly 


val 








91/31 




GCC 


GAC 


ACC 


GGA CTG 


GCC 


ala 


asp 


thr 


gly leu 


ala 








151/51 




ATG 


GGC 


GCC 


ACG GGC 


TTC 


met 


gly ala 


thr gly 


phe 








211/71 




TTG 


TTG 


TCC 


GCC TTC 


GGT 


leu 


leu 


ser 


ala phe 


gly 



SEQ ID N° 37A 
FIGURE 37A 



AAG 


GAC 


GCC 


AAA 


GCC 


GAC 


CTG 


lys 


asp 


ala 


lys 


ala 


asp 


leu 


TAC 


TAT 


TCC 


GGC 


GAC 


GAC 


GCG 


tyr 


tyr 


ser 


gly 


asp 


asp 


ala 


ATC 


AGC 


GTG 


ATT 


GCC 


CAC 


CTG 


ile 


ser 


val 


ile 


ala 


his 


leu 


TCT 


GGG 


GAT 


ATC 


GCC 


ACC 


GCC 


ser gly 


asp 


ile 


ala 


thr 


ala 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCI7FR98/01813 



116/185 



1/1 

GAT CCG CGC GTT GGC GTC GCA TCC GAA CAT 
asp pro arg val gly val ala ser glu his 
61/21 

GCA CAG CGG CGC CCA AAT CAT GGC CGA CAC 
ala gin arg arg pro asn his gly arg his 
121/41 

GCT CAA CCT GCC CTG GCT GGC CAT GGG CGC 
ala gin pro ala leu ala gly his gly arg 
181/61 

GGC AGC CGG GCA GCT TCG AGA GTT GTT GTC 
gly ser arg ala ala ser arg val val val 
241/81 

CCG CAA GAT C 
pro gin asp 



31/11 

CGT CGG AGT CAA GGA CGC CAA AGC CGA CCT 
arg arg ser gin gly arg gin ser arg pro 
91/31 

CGG ACT GGC CTA CTA TTC CGG CGA CGA CGC 
arg thr gly leu leu phe arg arg arg arg 
151/51 

CAC GGG CTT CAT CAG CGT GAT TGC CCA CCT 
his gly leu his gin arg asp cys pro pro 
211/71 

CGC CTT CGG TTC TGG GGA TAT CGC CAC CGC 
arg leu arg phe trp gly tyr arg his arg 



SEQ ID N° 37B 
FIGURE 37B 



1/1 

TCC GCG CGT TGG CGT CGC ATC 
ser ala arg trp arg arg ile 
61/21 

ACA GCG GCG CCC AAA TCA TGG 
thr ala ala pro lys ser trp 
121/41 

TCA ACC TGC CCT GGC TGG CCA 
ser thr cys pro gly trp pro 
181/61 

CAG CCG GGC AGC TTC GAG AGT 
gin pro gly ser phe glu ser 
241/81 
GCA AGA TC 
ala arg 







31/11 




CGA ACA 


TCG 


TCG GAG 


TCA 


arg thr 


ser 


ser glu 


ser 






91/31 




CCG ACA 


CCG 


GAC TGG 


CCT 


pro thr 


pro 


asp trp 


pro 






151/51 




TGG GCG 


CCA 


CGG GCT 


TCA 


trp ala 


pro 


arg ala 


ser 






211/71 




TGT TGT 


CCG 


CCT TCG 


GTT 


cys cys 


pro 


pro ser 


val 



SEQ ID N" 37C 
FIGURE 37C 



AGG ACG CCA AAG 


CCG 


ACC 


TGC 


arg thr pro lys 


pro 


thr 


cys 


ACT ATT CCG GCG 


ACG 


ACG 


CGC 


thr ile pro ala 


thr 


thr 


arg 


TCA GCG TGA TTG 


CCC 


ACC 


TGG 


ser ala OPA leu 


pro 


thr 


trp 


CTG GGG ATA TCG 


CCA 


CCG 


CCC 


leu gly ile ser 


pro 


pro 


pro 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 ^^CT/FR98/018J3 

117/185 



Sequence codante Rv2753c predite par 
contenant Seq 37A 



1/1 



GTG ACC 


ACC GTC 


GGA TTC 


GAC 


GTC 


GCA 


GCG 


val thr 


thr val 


qlv one 


aso 


val 


ala 


ala 


61/21 












ACA CCG 


TTT AGC 


GGC GAT 


GGC 


TCC 


CTG 


GAC 


thr pro phe ser 


qlv asp 


crlv 


ser 


leu 


asp 


121/41 












CTG GTC 


GAT CAG 


GGG TGC 


GAC 


GGT 


CTG 


GTG 


leu val 


asp gin 


qlv CVS 


asp 


qlv 


leu 


val 


181/61 














ACC ACC 


GAC GGG 


GAG AAA 


ATC 


GAG 


CTG 


CTG 


thr thr asp gly 


qlu lvs 


ile 


qlu 


leu 


leu 


241/81 














GCC CGT 


GTT ATC 


GCC GGT 


GCC 


GGC 


ACC 


TAT 


ala arg 


val ile 


ala gly 


ala 


olv 


thr 


tvr 


301/101 












GCT TGT 


GCG GCC 


GAG GGT 


GCG 


CAC 


GGG 


CTG 


ala cys 


ala ala 


qlu qlv 


ala 


his 


olv 


leu 


361/121 












CCG CAG 


CGG GGG 


CTG CAA 


GCC 


CAT 


TTC 


ACC 


pro gin 


arg gly 


leu gin 


ala 


his 


Dhe 


thr 


421/141 












CTG CTC 


TAT GAC 


ATC CCG 


GGG 


CGG 


TCG 


GCG 


leu leu 


tyr asp 


ile pro 


qly 


arq 


ser 


ala 


481/161 












TTG GCG 


TCG CAT 


CCG AAC 


ATC 


GTC 


GGA 


GTC 


leu. ala 


ser his 


pro asn 


ile 


val 


crly 


val 


541/181 












GCC CAA 


ATC ATG 


GCC GAC 


ACC 


GGA 


CTG 


GCC 


ala gin ile met 


ala asp 


thr 


gly 


leu 


ala 


601/201 












CCC TGG 


CTG GCC 


ATG GGC 


GCC 


ACG 


GGC 


TTC 


pro trp 


leu ala 


met gly 


ala 


thr 


gly 


phe 


661/221 










CAG CTT 


CGA GAG 


TTG TTG 


TCC 


GCC 


TTC 


GGT 


gin leu arg glu 


leu leu 


ser 


ala 


phe 


gly 


721/241 










AAC ATT 


GCG GTC 


GCC CCG 


CTG 


TGC 


AAC 


GCG 


asn ile 


ala val 


ala pro 


leu 


cys 


asn 


ala 


781/261 












AAG GCG 


GGC TTG 


CGG CTG 


CAG 


GGC 


ATC 


GAC 


lys ala gly leu 


arg leu 


gin 


gly 


ile 


asp 


841/281 










GCG ACA 


CCG GAG 


CAG ATC 


GAC 


GCG 


TTG 


GCC 


ala thr pro glu 


gin ile 


asp 


ala 


leu 


ala 



3ole et 


al. 


, 1998 


(Nature 




537 


-544 


31/11 


















CGC CTA 


GGA 


Arc 


CTG 


CTG 




GCG 


ATG 


GTG 


arg leu 


gly 


thr 


leu 


leu 


thr 


ala 


met 


val 


91/31 
















ACC GCC 


ACC 




GCG 


CGG 




GCC 


AAC 


CAC 


thr ala 


thr 


ala 


ala 


arg 


1 f*\\ 
icu 


ala 


asn 


his 


151/51 
















GTC TCG 


GGC 


ACC 


ACC 


GGC 




TCG 


CCG ACC 


val ser 


gly 


thr 


thr gly 


glu 


s er 


pro 


thr 


211/71 
















CGG GCC 


GTC 




GAA 


GCG 


GTG 


GGG 


GAC 


CGG 


arg ala 


val 


leu 


glu ala 


Val 




asp 


arg 


271/91 












GAC ACC 


GCG 




AGC 


ATC 


Cm 


CTG 


GCC 


AAG 


asp thr 


ala 


his 


ser 


ile 


a r rt 


leu 


ala lys 


331/111 


















CTG GTG 


GTC 


ACG 


CCC 


TAC 


1a1 


TCC 


AAG 


CCG 


leu val 


val 


thr 


pro 


tyr 


t Mr 

tyr 




lys 


pro 


391/131 














GCC GTC 


GCC 




GCG 


ACC 




CTG 


CCG 


ATG 


ala val 


ala 


aso 


ala 


thr 


glu 


leu 


pro met 


451/151 


















GTG CCG 


ATC 


GAG 


CCC 


GAC 




ATC 


CGC 


GCG 


val pro 


ile 


olu 


pro 


asp 


thr 


ile 


arg 


ala 


511/171 
















AAG GAC 


GCC 


AAA 


GCC 


GAC 




CAC 


AGC 


GGC 


lys asp 


ala 


lys 


ala 


asp 


leu 


his 


ser 


gly 


571/191 
















TAC TAT 


TCC 


GGC 


GAC 


GAC 


GCG 


CTC 


AAC 


CTG 


tyr tyr 


ser 


qly 


asp 


asp 


ala 


leu 


asn 


leu 


631/211 


















ATC AGC 


GTG 


ATT 


GCC 


CAC 


CTG 


GCA 


GCC 


GGG 


ile ser 


val 


lie 


ala 


his 


leu 


ala 


ala qlv 


691/231 


















TCT GGG 


GAT 


ATC 


GCC 


ACC 


GCC 


CGC 


AAG 


ATC 


ser gly 


asp 


ile 


ala 


thr 


ala 


arg 


lys 


ile 


751/251 














ATG AGC 


CGC 


CTG 


GGT 


GGG 


GTG 


ACG 


TTG 


TCC 


met ser 


arg 


leu 


gly gly 


val 


thr 


leu 


ser 


811/271 


















GTC GGT 


GAT 


CCC 


CGG 


CTG 


CCC 


CAG 


GTG 


GCC 


val gly 


asp 


pro 


arg 


leu 


pro 


gin 


val 


ala 


871/291 
















GCC GAC 


ATG 


CGC 


GCG 


GCC 


TCG 


GTG 


CTT 


CGG 


ala asp 


met 


arg 


ala 


ala 


ser 


val 


leu 


arg 



901/301 

TGA 

OPA 



SEQ ID N° 37D 
FIGURE 37D 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 




:T/FR98/01813 



118/185 



ORF d'apres 


Cole et 


al. , 


. 1998 {Nature 3! 


1/1 

A/ A 


















TAB. (ZCT 
inn 1 






CGI 


GGC 


CGA 


GAC 


CGC 


GCC 


61 /91 


glu 


a V* n 

aLlj 


arg 


gly 


arg 


asp 


arg 


ala 




fine 


cv*<v 


ACC 


CGA 


CGT 


GCC 


CTG 


GAC 


1 All 1 All 


gly 


pro 


unr 


arg 


arg 


aia 


leu 


asp 


121/41 
















CGA V?1T 


CGC 


CGG 


CCG 


GGC 


CTG 


CTA 


TCA 


GAG 


arg Veil 


arg 


arg 


pro 


gly 


1 All 

leu 


leu 


ser 


glu 


1 ft 1 /fil 
-LO 1/ Ol 
















CAA CGC 


CGG 


CTA 


CCT 


CCG 


GCA 


CAT 


CAT 


CGA 


gin arg 


arg 


1 All 

leu 


pro 


pro 


ala 


nis 


his 


arg 


















CAG CGI 


GTC 


GTT 


CTA 


CAT 


CAC 


CGG 


GAT 


CTC 


gin arg 


val 


Val 


leu 


his 


nis 


arg 


asp 


leu 


301/101 
















TTT 


CTC 


CIA 


CTC 


GCA 


GCT 


CTC 


CCA 


piu aid 


phe 




leu 


leu 


ax a 


ala 


leu 


pro 


361/121 




















GCC 


CGG 


CAT 


GGA 


GGA 


CGA 


CGC 


arg arg 


a K 

dia 


oia 


arg 


his 


gly 


gly 


arg 


arg 


421/141 
















err* 

CCG 


CGC 


CAC 


CTA 


CAG 


CGA 


GCT 


arg arg 


city 




arg 


his 


leu 


gin 


arg 


ala 


481/161 
















^/v\ 


CGG 


r*a*r 
GA1 


CCT 


GCG 


CCG 


CAA 


GCA 




gin 


a rg 


asp 


pro 


ax a 


pro 


gin 


ala 


















pan nrze 
Win (f^W* 


CAC 


CGA 


AAC 


CCG 


CAT 


CGT 


GGT 


GAC 


gin arg 


nis 


arg 


asn 


pro 


mm. m mm 

nxs 


arg 


gly 


asp 


OVA/ 4VJJ. 
















CGC nAl 


GCG 


GGC 


CAG 


CGA 


GCA 


CGC 


CGA 


CGT 


arg dsn 


di,ct 


gly 


gin 


arg 


ala 


arg 


arg 


arg 


















CGC 


err* 
CGC 


CGT 


GGC 


CCC 


CGC 


GGT 


Ola 


aid 


arg 


arg 


arg 


gly 


pro 


arg 


gly 


721/241 














CGA CGG 


CAC 


CGA 


GGT 


GGC 


GAC 


CAG 


CCC 


GTT 


arg arg 


his 


arg 


gly 


gly 


asp 


gin 


pro 


val 


781/261 
















GGA CAA 


ACA 


CGC 


GCG 


CTC 


GCG 


GCC 


GGG 


ATA 


gly gin 


thr 


arg 


ala 


leu 


ala 


ala 


gly 


ile 


841/281 
















ACC GTC 


GGA 


TTC 


GAC 


GTC 


GCA 


GCG 


CGC 


CTA 


thr val 


gly 


phe 


asp 


val 


ala 


ala 


arg 


leu 


901/301 
















TTT AGC 


GGC 


GAT 


GGC 


TCC 


CTG 


GAC 


ACC 


GCC 


phe ser 


gly 


asp 


gly 


ser 


leu 


asp 


thr 


ala 


961/321 
















GAT CAG 


GGG 


TGC 


GAC 


GGT 


CTG 


GTG 


GTC 


TCG 


asp gin 


gly 


cys 


asp 


gly 


leu 


val 


val 


ser 



537-544) contenant Rv2753c 



31/11 


















GCT GCG 


CGT 


GCA 


ACT 


GAT 


CGC 


CAA 


GAC 


CGA 


ala ala 


arg 


ala 


thr 


asp 


arg 


gin 


asp 


arg 


91/31 














CAC CGA 


CGC 


CGA 


CGG 


CGG 


ACC 


CGC 


GCT 


GGT 


his arg 


arg 


arg 


arg 


arg 


thr 


arg 


ala 


gly 


151/51 














CTG GTC 


CAA 


GCC 


CAA 


TCC 


CAA 


GAC 


CGC 


CAC 


leu val 


gin 


ala 


gin 


ser 


gin 


asp 


arg 


his 


211/71 














CGT CGG 


ACA 


TTT 


CTC 


GGT 


GCT 


AGA 


GCA 


TGC 


arg arg 


thr 


phe 


leu 


gly 


ala 


arg 


ala 


cvs 


271/91 














GCG ATC 


GTG 


CAC 


CCA 


CGA 


GCT 


GAT 


CCG 


CCA 


ala ile 


val 


his 


pro 


arg 


ala 


asp 


pro 


oro 


331/111 














GCG CTA 


CGT 


ACC 


CGA 


GAA 


GGA 


CTC 


GCG 


GGT 


ala leu 


arg 


thr 


arg 


glu 


gly 


leu 


ala 


gly 


391/131 














CGA CCT 


GCG 


CCA 


CAT 


CCT 


GAC 


CGA 


GGC 


CGC 


arg pro 


ala 


pro 


his 


pro 


asp 


arg 


gly 


arg 


451/151 














GCT GGC 


CAA 


GCT 


GGA 


AGC 


CAA 


GTT 


CGC 


CGA 


ala gly 


gin 


ala 


gly 


ser 


gin 


val 


arg 


arg 


511/171 












GGC CCG 


CCA 


AGC 


CGC 


CCG 


CGC 


GGT 


GCT 


GCC 


gly pro 


pro 


ser 


arg 


pro 


arg 


gly 


ala 


ala 


571/191 
















CGG CAA 


CTA 


CCG 


GGC 


CTG 


GCG 


GCA 


CTT 


CAT 


arg gin 


leu 


pro 


gly 


leu 


ala 


ala 


leu 


his 


631/211 


















GGA AAT 


CCG 


GCG 


ACT 


GGC 


CAT 


CGA 


ATG 


CCT 


gly asn 


pro 


ala 


thr 


gly 


his 


arg 


met 


pro 


691/231 












GTT CGC 


CGA 


CTT 


CGA 


GGT 


GAC 


CAC 


CCT 


GGC 


val arg 


arg 


leu 


arg 


gly 


asp 


his 


pro 


gly 


751/251 
















GGC GAC 


CGA 


AGC 


CTG 


AGG 


CGG 


CGT 


GTC 


GCT 


gly asp 


arg 


ser 


leu 


arg 


arg 


arg 


val 


ala 


811/271 












AAG CGC 


CAG 


GTA 


ACC 


TTG 


GGA 


GCC 


GTG 


ACC 


lys arg 


gin 


val 


thr 


leu 


gly 


ala 


val 


thr 


871/291 
















GGA ACC 


CTG 


CTG 


ACC 


GCG 


ATG 


GTG 


ACA 


CCG 


gly thr 


leu 


leu 


thr 


ala 


met 


val 


thr 


pro 


931/311 
















ACC GCG 


GCG 


CGG 


CTG 


GCC 


AAC 


CAC 


CTG 


GTC 


thr ala 


ala 


arg 


leu 


ala 


asn 


his 


leu 


val 


991/331 
















GGC ACC 


ACC 


GGC 


GAG 


TCG 


CCG 


ACC 


ACC 


ACC 


gly thr 


thr 


gly 


glu 


ser 


pro 


thr 


thr 


thr 



SEQ ID N° 37F 



FIGURE 37 F 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 




'CT/FR98/01813 



119/185 



1021/341 1051/351 



GAC GGG GAG AAA 

V*#»W WWW W«tV 


ATC 


GAG CTG 


CTG 


CGG 


GCC 


GTC TTG GAA 


GCG 


bib 


GGG 


GAC 


CGG 


GCC 


CGT 


aso crlv crlu lvs 


ile 


rrl tj 1 l 
y a u icu 


leu 




ala 

d J- d 


val leu glu ala 


vaj. 


gly 


asp 


arg 


ala 


arg 


1081/361 












1111/371 








GTT ATC GCC GGT 


GCC 




TAT 






GCG CAC AGC 


ATC 


CGG 


CTG 


GCC 


AAG 


GCT 


TGT 


val 11© ala rrl v 


ala 


gly thr 


tyr 


asp 




ala his ser 


ile 


arg 


leu 


ala 


lys 


ala 


cys 


1141/381 












1171/391 










GCG GCC GAG GGT 


GCG 


CAC GGG 


CTG 


CTG 


GTG 


GTC ACG CCC 


TAC 


rp * rw 

1A1 


TCC 


AAG 


CCG 


CCG 


CAG 


ala ala alii alv 


ala 


his gly 


leu 




val 
vox 


val thr pro 


tyr 


tyr 


ser 


lys 


pro 


pro gin 


1201/401 












1231/411 












CGG GGG CTG CAA 


GCC 


CAT TTC 


ACC 


GCC 


GTC 


GCC GAC GCG 


ACC 




Lib 


CCG 


ATG 


CTG 


CTC 


ara alv leu aln 


ala 


his nhe 


thr 


ala 


val 


ala asp ala 


thr 


glu 


leu 


pro 


met 


leu leu 


1261/421 












1291/431 












TAT GAC ATC CCG 


GGG 


CGG TCG 


GCG 


GTG 


CCG 


ATC GAG CCC 


GAC 




J\l G 


GGC 


GCG 


TTG 


GCG 


tyr asp ile pro 


alv 


arg ser 


ala 


val 


pro 


ile glu pro 


asp 


cnr 


lie 


arg 


_ ^ _ 

ala 


leu 


ala 


1321/441 












1351/451 












TCG CAT CCG AAC 


ATC 


GTC GGA 


GTC 


AAG 


GAC 


GCC AAA GCC 


GAC 


C fG 


CAC 


AGC 


GGC 


GCC 


CAA 


ser his pro asn 


ile 


val gly 


val 


lys 


asp 


ala lys ala 


asp 


leu 


his 


ser 


giy 


ala qln 


1381/461 












1411/471 
















ATC ATG GCC GAC 


ACC 


GGA CTG 


GCC 


TAC 


TAT 


TCC GGC GAC 


GAC 


Gl«o 


L1L 


AAC 


CTG 


CCC 


TGG 


lie met ala asp 


thr 


gly leu 


ala 


tyr 


tyr 


ser gly asp asp 


ala 


leu 


asn 


leu 


Dro trp 


.1441/481 












1471/491 
















CTG GCC ATG GGC 


GCC 


ACG GGC 


TTC 


ATC 


AGC 


GTG ATT GCC 


CAC 


CTG 


GCA 


GCC 


GGG 


CAG 


CTT 


leu ala met gly 


ala 


thr gly 


phe 


ile 


ser 


val ile ala 


his 


leu 


ala 


ala 


gly 


aln leu 


1501/501 












1531/511 














CGA GAG TTG TTG 


TCC 


GCC TTC 


GGT 


TCT 


GGG 


GAT ATC GCC 


ACC 


GCC 


CGC 


AAG 


ATC 


AAC 


ATT 


arg glu leu leu 


ser 


ala phe 


gly 


ser 


gly 


asp ile ala 


thr 


ala 


arg 


lys 


ile 


asn 


ile 


1561/521 












1591/531 












GCG GTC GCC CCG 


CTG 


TGC AAC 


GCG 


ATG 


AGC 


CGC CTG GGT 


GGG 


GTG 


ACG 


TTG 


TCC 


AAG 


GCG 


ala val ala pro 


leu 


cys asn 


ala 


met 


ser 


arg leu gly gly 


val 


thr 


leu 


ser 


lys 


ala 


1621/541 












1651/551 














GGC TTG CGG CTG 


CAG 


GGC ATC 


GAC 


GTC 


GGT 


GAT CCC CGG 


CTG 


CCC 


CAG 


GTG 


GCC 


GCG 


ACA 


gly leu arg leu 


gin 


gly ile 


asp val gly 


asp pro arg 


leu 


pro 


gin 


val 


ala 


ala 


thr 


1681/561 












1711/571 












CCG GAG CAG ATC 


GAC 


GCG TTG 


GCC 


GCC 


GAC 


ATG CGC GCG 


GCC 


TCG 


GTG 


CTT 


CGG 


TGA 




pro glu gin ile 


asp 


ala leu 


ala' ala 


asp 


met arg ala 


ala 


ser 


val 


leu 


arg 


OPA 





SEQ ID N° 37F (suite 1) 
FIGURE 37 F (suite 1) 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 




PCT/FR98/01813 



120/185 



l/i 31/11 

GCG GTG AAC TGG TGG GCC CGG ATG GTT CAA GTA CGC CGT CGC AAA CTC GAG CAC AAC AGG 
ala val asn trp trp ala arg met val gin val arg axg arg lys leu glu his asn arg 
61/21 91/31 

AGA CGA CGG ATG GAA GGA GAT GCT GGC GCC GGC CAG CTG AAC CCT GCC GAT GCG AAT AAG 
arg arg arg met glu gly asp ala gly ala gly gin leu asn pro ala asp ala asn lys 
121/41 151/51 

TCG TCG TCT ACG GAG GTG AAG GCG GCG GAT TCG GCG GAA TCT GAC GCC GGA GCC GAC CAG 
ser ser ser thr glu val lys ala ala asp ser ala glu ser asp ala gly ala asp gin 
161/61 211/71 

ACT GGC CCG CAG GTG AAG GCG GCG GAT TCG GCG GAA TCT GAC GCC GGA GAG CTC GGC GAG 
thr gly pro gin val lys ala ala asp ser ala glu ser asp ala gly glu leu gly glu 
241/81 271/91 

GAC GCG TGC CCA GAA CAG GCC CTC GTC GAG CGG CGC CCG TCG CGG TTG CGG CGA GGC TGG 
asp ala cys pro glu gin ala leu val glu arg arg pro ser arg leu arg arg gly trp 
301/101 331/111 

CTT GTT GGC ATT GCG GCG ACG CTG CTC GCG TTG GCC GGT GGC CTT GGC GCA GCG GGT TAT 
leu val gly ile ala ala thr leu leu ala leu ala gly gly leu gly ala ala gly tyr 
361/121 391/131 

TTT GCG TTG CGC TCA CAC CAG GAA AGC CAA TCA ATC GCG CGC GAG GAC CTT GCG GCC ATT 
phe ala leu arg ser his gin glu ser gin ser ile ala arg glu asp leu ala ala ile 
421/141 451/151 

GAG GCC GCT AAG GAT TGC GTT GCG GCC ACG CAG GCA CCC GAT GCT GGG GCG ATG TCG GCT 
glu ala ala lys asp cys val ala ala thr gin ala pro asp ala gly ala met ser ala 
481/161 

AGC ATG CAG AAG ATC 
ser met gin lys ile 

SEQ ID N° 38A 



FIGURE 38A 



1/1 31/11 

CAG CGG TGA ACT GGT GGG CCC GGA TGG TTC AAG TAC GCC GTC GCA AAC TCG AGC ACA ACA 
gin arg OPA thr gly gly pro gly trp phe lys tyr ala val ala asn ser ser thr thr 
61/21 91/31 

GGA GAC GAC GGA TGG AAG GAG ATG CTG GCG CCG GCC AGC TGA ACC CTG CCG ATG CGA ATA 
gly asp asp gly trp lys glu met leu ala pro ala ser OPA thr leu pro met arg ile 
121/41 151/51 

AGT CGT CGT CTA CGG AGG TGA AGG CGG CGG ATT CGG CGG AAT CTG ACG CCG GAG CCG ACC 
ser arg arg leu arg arg OPA arg arg arg ile arg arg asn leu thr pro glu pro thr 
181/61 211/71 

AGA CTG GCC CGC AGG TGA AGG CGG CGG ATT CGG CGG AAT CTG ACG CCG GAG AGC TCG GCG 
arg leu ala arg arg OPA arg arg arg ile arg arg asn leu thr pro glu ser ser ala 
241/81 271/91 

AGG ACG CGT GCC CAG AAC AGG CCC TCG TCG AGC GGC GCC CGT CGC GGT TGC GGC GAG GCT 
arg thr arg ala gin asn arg pro ser ser ser gly ala arg arg gly cys gly glu ala 
301/101 331/111 

GGC TTG TTG GCA TTG CGG CGA CGC TGC TCG CGT TGG CCG GTG GCC TTG GCG CAG CGG GTT 
gly leu leu ala leu arg arg arg cys ser arg trp pro val ala leu ala gin arg val 
361/121 391/131 

ATT TTG CGT TGC GCT CAC ACC AGG AAA GCC AAT CAA TCG CGC GCG AGG ACC TTG CGG CCA 
ile leu arg cys ala his thr arg lys ala asn gin ser arg ala arg thr leu arg pro 
421/141 451/151 

TTG AGG CCG CTA AGG ATT GCG TTG CGG CCA CGC AGG CAC CCG ATG CTG GGG CGA TGT CGG 
leu arg pro leu arg ile ala leu arg pro arg arg his pro met leu gly arg cys arc 
481/161 * 
CTA GCA TGC AGA AGA TC 
leu ala cys arg arg 



SEQ ID N° 38B 



FEUILLE DE REMW3l^ifl?(REGLE 26) 



WO 99/09186 ^^>CT/FR98/01813 

121/185 



1/1 








AGC GGT 


GAA 


CTG 


GTG GGC 


ser gly 


glu 


leu 


val gly 


61/21 








GAG ACG 


ACG 


GAT 


GGA AGG 


glu thr 


thr 


asp 


gly arg 


121/41 






GTC GTC 


GTC 


TAC 


GGA GGT 


val val 


val 


tyr 


gly gly 


181/61 








GAC TGG 


CCC 


GCA 


GGT GAA 


asp trp 


pro 


ala 


gly glu 


241/81 








GGA CGC 


GTG 


CCC 


AGA ACA 


gly arg 


val 


pro 


arg thr 


301/101 








GCT TGT 


TGG 


CAT 


TGC GGC 


ala cys 


trp 


his 


cys gly 


361/121 








TTT TGC 


GTT 


GCG 


CTC ACA 


phe cys 


val 


ala 


leu thr 


421/141 








TGA GGC 


CGC 


TAA 


GGA TTG 


OPA gly 


arg 


OCH 


gly leu 


481/161 








TAG CAT 


GCA 


GAA 


GAT C 


AMB his 


ala 


glu 


asp 



31/11 

CCG GAT GGT TCA AGT ACG CCG 
pro asp gly ser ser thr pro 
91/31 

AGA TGC TGG CGC CGG CCA GCT 
arg cys trp arg arg pro ala 
151/51 

GAA GGC GGC GGA TTC GGC GGA 
glu gly gly gly phe gly gly 
211/71 

GGC GGC GGA TTC GGC GGA ATC 
gly gly gly phe gly gly ile 
271/91 

GGC CCT CGT CGA GCG GCG CCC 
gly pro arg arg ala ala pro 

331/111 
GAC GCT GCT CGC GTT GGC CGG 
asp ala ala arg val gly arg 

391/131 
CCA GGA AAG CCA ATC AAT CGC 
pro gly lys pro ile asn arg 

451/151 
CGT TGC GGC CAC GCA GGC ACC 
arg cys gly his ala gly thr 



TCG 


CAA 


ACT 


CGA 


GCA 


CAA 


CAG 


ser 


gin thr 


arg 


ala 


gin 


crln 


GAA 


CCC 


TGC 


CGA 


TGC 


GAA 


TAA 


glu pro 


cys 


aro 


CVS 


glu 


OCH 


ATC 


TGA 


CGC 


CGG 


AGC 


CGA 


CCA 


ile 


OPA 


arg 


arg 


ser 


arg 


pro 


TGA 


CGC 


CGG 


AGA 


GCT 


CGG 


CGA 


OPA 


arg 


arg 


arg 


ala 


arg 


arg 


GTC 


GCG 


GTT 


GCG 


GCG 


AGG 


CTG 


val 


ala 


val 


ala 


ala 


arg 


leu 


TGG 


CCT 


TGG 


CGC 


AGC 


GGG 


TTA 


trp pro trp 


arg 


ser 


gly 


leu 


GCG 


CGA 


GGA 


CCT 


TGC 


GGC 


CAT 


ala 


arg gly 


pro 


cys 


gly 


his 


CGA 


TGC 


TGG 


GGC 


GAT 


GTC 


GGC 


arg 


cys 


trp 


gly 


asp 


val 


gly 



SEQ ID N° 38C 
FIGURE 38C 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



122/185 



Sequence Rv0175 predite par Cole et ai., 1998 (Nature 393 537-544) et contenant 
seq38A 



1/1 31/11 



GTG AAG 


GCG 


GCG 


GAT 


TCG 


GCG 


GAA 


TCT 


GAC GCC GGh 
\3/v«* \?VA« uVxrv 


GCC 


G'L.C 


far** 




GGC 


CCG 


CAG 


GTG 


val lys 


ala 


ala 


asp 


ser 


ala 


glu 


ser 


aop aid y-^y 


ala 


asp 


gin 


tnr 


gly 


pro 


gin 


val 


61/21 
















91/^1 
^ X/ O X 










AAG GCG 


GCG 


GAT 


TCG 


GCG 


GAA 


TCT 


GAC 


GCC gga nar: 

V7\<v« vsurV otrVo 


CTC 


GCC 


GAG 


ft r» 
GAC 


****** 
GCG 


TGC 


CCA 


GAA 


lys ala 


ala 


asp 


ear 


axel 


glu 


ser 


asp 


ala gly glu 


leu 


giy 


glu 


asp 


ala 


cys 


pro 


glu 


121/41 
















131/ OA 










CAG GCC 


CTC 


GTC 


GAG 


CGG 


CGC 


CCG 


TCG 


CGG TTP fff 


CGA 


GGC 


TGG 


CTT 


GTT 


GGC 


ATT 


GCG 


nl n ala 


leu 


val 


glu 


a rg 


arg 


pro 


ser 


arg leu arg 


arg 


gly 


trp 


leu 


val 


gly 


ile 


ala 


181/61 
















21 1 

611/ 11 














GCG ACG 


CTG 


CTC 




X IV) 


GCC 


GGT 


rice 


Ctt nrr* r*r»iv 


rrr* 
GCG 


GGT 


TAT 


TTT 


GCG 


TTG 


CGC 


TCA 


ala thr 
diet uin 


1CU 


leu 


aid 


leu 


ala 


gly 


gly 


leu gly ala 


ala 


giy 


tyr 


phe 


ala 


leu 


arg 


ser 


241/81 
















£ / 1/ 7l 












CAC CAG 


GAA 


AGC 


CAA 


TCA 


ATC 


GCG 


CGC 


GAG GAC CTT 




GCC 


ATT 


GAG 


GCC 


GCT 


AAG 


GAT 


his gin 


glu 


ser 


gin 


ser 


ile 


ala 


arg 


glu asp leu 


ala 


ala 


lie 


glu 


ala 


ala 


lys 


asp 


301/101 
















331/ 111 












TGC GTT 


GCG 


GCC 


ACG 


CAG 


GCA 


CCC 


GAT 


GCT GGG GCG 


ATG 


TCG 


GCT 


AGC 


ATG 


CAG 




ATP 


cys val 


ala 


ala 


thr 


gin 


ala 


pro 


asp 


ala gly ala 


met 


ser 


ala 


ser 


met 


gin 


lys 


ile 


361/121 
















391/131 














ATC GAG 


TGT 


GGC 


ACC 


GGT 


GAT 


TTC 


GGT 


GCC CAG GCG 


TCG 


TTG 


TAC 


ACC 


AGC 


ATG 


CTC 


GTC 


ile glu 


cys 


gly 


thr 


gly 


asp phe 


gly 


ala gin ala 


ser 


leu 


tyr 


thr 


ser 


met 


leu 


val 


421/141 
















451/151 
















GAG GCG 


TAT 


CAA 


GCG 


GCC 


AGC 


GTC 


CAC 


GTG CAA GTG 


ACC 


GAT 


ATG 


CGC 


GCG 


GCG 


GTC 


GAG 


glu ala 


tyr 


gin 


ala 


ala 


ser 


val 


his 


val gin val 


thr 


asp 


met 


arg 


ala 


ala 


val 


glu 


481/161 
















511/171 












CGC AAC 


AAC 


AAT 


GAC 


GGG 


TCG 


GTC 


GAT 


GTT CTG GTG 


GCG 


CTC 


CGG 


GTC 


A*VG 


GTG 


TCC 


AAC 


arg asn 


asn 


asn 


asp 


gly 


ser 


val 


asp 


val leu val 


ala 


leu 


arg 


val 


lys 


val 


ser 


asn 


541/181 
















571/191 














ACC GAC 


TCG 


GAT 


GCC 


CAT 


GAA 


GTC 


GGC 


TAC CGT CTT 


CGG 


GTC. 


CGG 


ATG 


GCA 


CTG 


GAT 


GAG 


thr asp 


ser 


asp 


ala 


his 


glu val 


gly 


tyr arg leu 


arg 


val 


arg 


met 


ala 


leu 


asp 


glu 


601/201 
















631/211 












GGC CGC 


TAT 


AAG 


ATC 


GCC 


AAA 


CTC 


GAC 


CAG GTG ACG 


AAG 


TGA 














gly arg 


tyr 


lys 


ile 


ala 


lys leu 


asp 


gin val thr 


lys 


OPA 















SEQ ID N° 38D 
. FIGURE 38D 



FEUILLE DE REMPLACEMENT (REGLE 26) 




WO 99/09186 IjJIp 1|pPCT/FR98/01813 

123/185 

ORF d'apres Cole et al., 1998 {Nature 393 537-544) Contenant Rv0175 
1/1 31/11 

TGA ACT GGT GGG GCC GGA TGG TGT CAA GTA CGC CGT CGC AAA CTC GAG CAC AAC AGG AGA 
OPA thr gly gly ala gly trp cys gin val arg arg arg lys leu glu his asn arg arg 
61/21 91/31 

CGA CGG ATG GAA GGA GAT GCT GGC GCC GGC CAG CTG AAC CCT GCC GAT GCG AAT AAG TCG 
arg arg met glu gly asp ala gly ala gly gin leu asn pro ala asp ala asn lys ser 
121/41 151/51 

TCG TCT ACG GAG GTG AAG GCG GCG GAT TCG GCG GAA TCT GAC GCC GGA GCC GAC CAG ACT 
ser ser thr glu val lys ala ala asp ser ala glu ser asp ala gly ala asp qln thr 
181/61 211/71 

GGC CCG CAG GTG AAG GCG GCG GAT TCG GCG GAA TCT GAC GCC GGA GAG CTC GGC GAG GAC 
gly pro gin val lys ala ala asp ser ala glu ser asp ala gly glu leu glv glu asp 
241/81 271/91 

GCG TGC CCA GAA CAG GCC CTC GTC GAG CGG CGC CCG TCG CGG TTG CGG CGA GGC TGG CTT 
ala cys pro glu gin ala leu val glu arg arg pro ser arg leu arg arg gly trp leu 
301/101 331/111 

GTT GGC ATT GCG GCG ACG CTG CTC GCG TTG GCC GGT GGC CTT GGC GCA GCG GGT TAT TTT 
val gly ile ala ala thr leu leu ala leu ala gly gly leu gly ala ala gly tyr phe 
361/121 391/131 

GCG TTG CGC TCA CAC CAG GAA AGC CAA TCA ATC GCG CGC GAG GAC CTT GCG GCC ATT GAG 
ala leu arg ser his gin glu ser gin ser ile ala arg glu asp leu ala ala ile glu 
421/141 451/151 

GCC GCT AAG GAT TGC GTT GCG GCC ACG CAG GCA CCC GAT GCT GGG GCG ATG TCG GCT AGC 
ala ala lys asp cys val ala ala thr gin ala pro asp ala gly ala met ser ala ser 
481/161 511/171 

ATG CAG AAG ATC ATC GAG TGT GGC ACC GGT GAT TTC GGT GCC CAG GCG TCG TTG TAC ACC 
met gin lys ile ile glu cys gly thr gly asp phe gly ala gin ala ser leu tyr thr 
541/181 571/191 

AGC ATG CTC GTC GAG GCG TAT CAA GCG GCC AGC GTC CAC GTG CAA GTG ACC GAT ATG CGC 
ser met leu val glu ala tyr gin ala ala ser val his val gin val thr aso met ara 
601/201 631/211 

GCG GCG GTC GAG CGC AAC AAC AAT GAC GGG TCG GTC GAT GTT CTG GTG GCG CTC CGG GTC 
ala ala val glu arg asn asn asn asp gly ser val asp val leu val ala leu arg val 
661/221 691/231 

AAG GTG TCC AAC ACC GAC TCG GAT GCC CAT GAA GTC GGC TAC CGT CTT CGG GTC CGG ATG 
lys val ser asn thr asp ser asp ala his glu val gly tyr arg leu arg val arg met 
721/241 751/251 

GCA CTG GAT GAG GGC CGC TAT AAG ATC GCC AAA CTC GAC CAG GTG ACG AAG TGA 
ala leu asp glu gly arg tyr lys ile ala lys leu asp gin val thr lys OPA 



SEQ ID N° 38F 
FIGURE 38F 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 




PCT/FR98/01813 



124/185 



1/1 31/11 

ACA CCT CCC CCC CCG CCG CCG CTG CCG CCG GTT CCC TTT CCC AAG GAA TGT CCG GCG CCG 
thr pro pro pro pro pro pro leu pro pro val pro phe pro lys glu cys pro ala pro 
61/21 91/31 

GGC GTG ATG CAA GGC TGC CTT GAG AGC ACC AGC GGC TTG ATC ATG GGC ATC GAC AGC AAG 

gly val met gin gly cys leu glu ser thr ser gly leu ile met gly ile asp ser lys 

121/41 151/51 

ACC GCA CTG GTC GCC GAG CGC ATC ACC GGT GCC GTC GAG GAG ATC 

thr ala leu val ala glu arg ile thr gly ala val glu glu ile 



SEQ ID N° 39A 
FIGURE 39A 



1/1 31/11 

CAC CTC CCC CCC CGC CGC CGC TGC CGC CGG TTC CCT TTC CCA AGG AAT GTC CGG CGC CGG 
his leu pro pro arg arg arg cys arg arg phe pro phe pro arg asn val arg arg arg 
61/21 91/31 

GCG TGA TGC AAG GCT GCC TTG AGA GCA CCA GCG GCT TGA TCA TGG GCA TCG ACA GCA AGA 

ala OPA cys lys ala ala leu arg ala pro ala ala OPA ser trp ala ser thr ala arg 

121/41 151/51 

CCG CAC TGG TCG CCG AGC GCA TCA CCG GTG CCG TCG AGG AGA TC 

pro his trp ser pro ser ala ser pro val pro ser arg arg 



SEQ ID N° 39B 
FIGURE 39B 



1/1 

GAC ACC TCC CCC CCC GCC GCC 
asp thr ser pro pro ala ala 
61/21 

GGG CGT GAT GCA AGG CTG CCT 
gly arg asp ala arg leu pro 
121/41 

GAC CGC ACT GGT CGC CGA GCG 
asp arg thr gly arg arg ala 



31/11 

GCT GCC GCC GGT TCC CTT 
ala ala ala gly ser leu 
91/31 

TGA GAG CAC CAG CGG CTT 
OPA glu his gin arg leu 
151/51 

CAT CAC CGG TGC CGT CGA 
his his arg cys arg arg 



SEQ ID N° 39C 
FIGURE 39C 



TCC CAA GGA ATG TCC GGC GCC 
ser gin gly met ser gly ala 

GAT CAT GGG CAT CGA CAG CAA 
asp his gly his arg gin gin 

GGA GAT C 
gly asp 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 




T/FR98/01813 



125/185 



Sequence codante Rv3006 predite par Cole et al. ( 1998 (Nature 393 S37-S44) et contenant 
s e g3 9A 

1/1 31/11 

l TCC GGA CTC GCC C 
r ser gly leu ala < 

91/31 
: GAC GCT CAA TCT C 
i asp ala gin ser < 

151/51 
l CCT CCC CCC CCG C 
• pro pro pro pro { 

211/71 
: GTG ATG CAA GGC 1 
' val met gin gly < 
271/91 
GCA CTG GTC GCC C 
ala leu val ala c 
331/111 
' AAG GTA AAG ACG C 
lys val lys thr \ 
391/131 
> CTG TCG CCC ACC 1 
leu ser pro thr t 

451/151 
AAC CGG GTG GTG C 
asn arg val val c 

Sll/171 
AAA GGT GCT GCC C 
lys gly ala ala c 

571/191 
ATG ACC GGG GAT C 
met thr gly asp * 

6317211 
GTC CTG CGT ATC C 
val leu arg ile c 

691/231 
GGC ATC GGC TCC C 
gly ile gly ser c 

751/251 
GAC CGC ACG CCA ? 
asp arg thr pro t 

811/271 
GTA TGG ACC TGG C 
val trp thr trp p 

871/291 
CTG GTC AAC CTG 7> 
leu val asn leu i 

931/311 
GCG GTC ACC GGA G 
ala val thr gly <g 

991/331 
CGG ATG TCG CCG C 
arg met ser pro a 
1051/351 
GAG AAG CTC GAC G 
glu lys leu a3p a 
1111/371 



ATG TGG 


ACA 


ACG 


CGG 


TTG GTT 


Met trp 


thr 


thr 


arg 


leu val 


61/21 








TCG AGC 


GGC 


TGC 


GCA 


CGG TTC 


ser ser 


gly 


cys 


ala 


arg phe 


121/41 








CTG CGG 


CCC 


CAA 


CCC 


AGC TCG 


leu arg 


pro 


gin 


pro 


ser ser 


181/61 










CCC AAG 


GAA 


TGT 


CCG 


GCG CCG 


pro lys 


glu 


cys 


pro 


ala pro 


241/81 










ATC ATG 


GGC 


ATC 


GAC 


AGC AAG 


ile met 


gly 


ile 


asp 


ser lys 


301/101 








GAG ATC 


TCT 


ATC 


AGC 


GCC GAG 


glu ile 


ser 


ile 


ser 


ala glu 


361/121 








GAC GGT 


GGC 


TTG 


ATG 


GAC ATT 


asp gly 


giy 


leu 


met 


asp ile 


421/141- 








GCC TAG 


ATC 


AGC 


ACG 


CCC ACC 


ala tyr 


ile 


ser 


thr 


pro thr 


481/161 








AAG GAC 


ATC 


CTG 


ACC 


GGC ATC 


lys asp 


ile 


leu 


thr 


gly ile 


541/181 








ACC AGT 


CCC 


ACC 


ACG 


CTG GTC 


thr ser 


pro 


thr 


thr 


leu val 


601/201 










GAT CCC 


CAA 


TCG 


TTG 


GCC GGT 


asp pro 


gin 


ser 


leu 


ala gly 


661/221 








ACG CCG 


CCG 


ACG 


ACG 


GCG CTG 


thr pro 


pro 


thr 


thr 


ala leu 


721/241 










GTC GAC 


GGC 


TCG 


CTA 


TAT GTC 


val asp 


gly 


ser 


leu 


tyr val 


781/261 








ACC AAG 


AAC 


TCG 


GAG 


GTC TCT 


thr lys 


asn 


ser 


glu 


val ser 


841/281 








TGT GCC 


GCG 


ATG 


GAC 


GGC ACC 


cys ala 


ala 


met 


asp 


gly thr 


901/301 






GTC CGG 


CTC 


GCG 


CCG 


TCG ACC 


val arg 


leu 


ala 


pro 


ser thr 


961/321 










ACT CAT 


GCG 


CAT 


GCG 


TGG GCA 


thr his 


ala 


his 


ala 


trp ala 


1021/341 






GTC AAC 


AAG 


ACC 


GCC 


GGC GAC 


val asn 


lys 


thr 


ala 


gly asp 


1001/361 






CAG GGT 


GGC 


GGC 


TTC 


CCG CGC 


gin gly gly 


gly 


phe 


pro arg 



CTG TGC 
leu cys 


GCG 
ala 


GCA 
ala 


GTG 
val 


CTG GTA 
leu val 


CCG TTC 
pro phe 


ACC 
thr 


ACC 
thr 


GAA 
glu 


CCG GAG 
pro glu 


CCG CTG 
pro leu 


CCG 
pro 


CCG 
pro 


GTT 
val 


CCC TTT 
pro phe 


CTT GAG 
leu glu 


AGC 
ser 


ACC 
thr 


AGC 
ser 


GGC TTG 
gly leu 


CGC ATC 
arg ile 


ACC 
thr 


GGT 
gly 


GCC 
ala 


GTC GAG 
val glu 


ATC CCC 
ile pro 


GTG 
val 


GAT 
asp 


CCT 
pro 


GCC GGT 
ala gly 


TCG CAA 
ser gin 


GAC 
asp 


CGG 
arg 


CTG 
leu 


ATG TAC 
met tyr 


GTG GCC 
val ala 


GAC 
asp 


GGC 
gly 


GAC 
asp 


ATC CCC 
ile pro 


AAC ACC 
asn thr 


GGG 

gly 


GCG 
ala 


CTG 
leu 


ATC TTC 
ile phe 


GGC GAC 
gly asp 


CCG 
pro 


GCG 
ala 


TTG 
leu 


GCC GCC 
ala ala 


CAG CCC 
gin pro 


ACC 
thr 


ACC 
thr 


ATC 
ile 


GGC CAG 
gly gin 


GGC GGC 

gly gly 


TTG 
leu 


TGC 
cys 


ATC 
ile 


GAT CCG 
asp pro 


GCG GAC 
ala asp 


CGA 
arg 


TTG 
leu 


CAG 
gin 


CGC ATC 
arg ile 


GAC AAG 
asp lys 


CCC 
pro 


GGC 
gly 


GTG 
val 


GCC GGG 
ala gly 


AAT ACC 
asn thr 


AAA 
lys 


CTG 
leu 


ACG 
thr 


GTG GCG 
val ala 


CCC GAC 
pro asp 


GTT 
val 


GTC 
val 


CGC 
arg 


AAA GAC 
lys asp 


GGC AAC 
gly asn 


GTC 
val 


TGG 
trp 


GGA 

gly 


GCC ACC 
ala thr 


GTG GTG 
val val 


TTC 
phe 


CCG 
pro 


CTG 
leu 


TTC CCG 
phe pro 



SEQ ID N° 39D 



FIGURE 39D 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 




:T/FR98/01813 



126/185 



ORF d'apres Cole et al., 1998 (Nature 393 537-544) et contenant Rv3006 



1/1 


















31/11 


















TAA GGC 


CAT 


TTA 


GTG 


CCG 


AAT 


TGG 


GGA 


TTT 


GAG CGG 


CGC 


TTT 


CGC 


CAG 


ACA 


ATC 


CGC 


ACA 


OCH gly 


his 


leu 


val 


pro 


asn 


trp 


gly 


phe 


glu arg 


arg 


phe 


arg 


gin 


thr 


ile 


arc 


thr 


61/21 


















91/31 












TTG ACC 


CTG 


ACC 


AGC 


CCA 


CCA 


AAA 


GGC 


CCC 


AAT TGG 


GCC 


GCC 


ATG 


CCG 


ACA 


GTG 


CGC 


ACC 


leu thr 


leu 


thr 


ser 


pro 


pro 


lys 


gly 


pro 


asn trp 


ala 


ala 


met 


pro 


thr 


val 


arc 


thr 


121/41 


















151/51 














CCG GCA 


GGT 


GGC 


GGC 


GAT 


GCC 


CAC 


AAT 


GTC 


CGT AGC 


CTG 


TCG 


GTC 


ATG 


TGG 


ACA 


ACG 


CGG 


pro ala 


gly 


gly 


gly 


asp 


ala 


his 


asn 


val 


arg ser 


leu 


ser 


val 


met 


tro 


thr 


thr 


arg 


181/61 


















211/71 














TTG GTT 


CGA 


TCC 


GGA 


CTC 


GCC 


GCG 


CTG 


TGC 


GCG GCA 


GTG 


CTG 


GTA 


TCG 


AGC 


GGC 


TGC 


GCA 


leu val 


arg 


ser 


gly 


leu 


ala 


ala 


leu 


cys 


ala ala 


val 


leu 


val 


ser 


ser 


yxy 


CVS 


ala 


241/81 


















271/91 














CGG TTC 


AAC 


GAC 


GCT 


CAA 


TCT 


CAG 


CCG 


TTC 


ACC ACC 


GAA 


CCG 


GAG 


CTG 


CGG 


CCC 


CAA 


CCC 


arg phe 


asn 


asp 


ala 


gin 


ser 


gin 


pro 


phe 


thr thr 


glu 


pro 


glu 


leu 


aro 


nro 


gin 


pro 


301/101 


















331/111 








AGC TCG 


ACA 


CCT 


CCC 


CCC 


CCG 


CCG 


CCG 


CTG 


CCG CCG 


GTT 


CCC 


TTT 


CCC 


AAG 


GAA 


TGT 


CCG 


ser ser 


thr 


pro 


pro 


pro 


pro 


pro 


pro 


leu 


pro pro 


val 


pro 


phe 


pro 


lys 


alu 


CVS 


pro 


361/121 


















391/131 










GCG CCG 


GGC 


GTG 


ATG 


CAA 


GGC 


TGC 


CTT 


GAG 


AGC ACC 


AGC 


GGC 


TTG 


ATC 


ATG 


GGC 


ATC 


GAC 


ala pro 


gly 


val 


met 


gin 


gly 


cys 


leu 


glu 


ser thr 


ser 


gly 


leu 


ile 


met 


alv 


ile 


asp 


421/141 


















451/151 












AGC AAG 


ACC 


GCA 


CTG 


GTC 


GCC 


GAG 


CGC 


ATC 


ACC GGT 


GCC 


GTC 


GAG 


GAG 


ATC 


TCT 


ATC 


AGC 


ser lys 


thr 


ala 


leu 


val 


ala 


glu 


arg 


ile 


thr gly 


ala 


val 


glu 


glu 


ile 


ser 


ile 


ser 


481/161 


















511/171 












GCC GAG 


CCG 


AAG 


GTA 


AAG 


ACG 


GTC 


ATC 


CCC 


GTG GAT 


CCT 


GCC 


GGT 


GAC 


GGT 


GGC 


TTG 


ATG 


ala glu 


pro 


lys 


val 


lys 


thr 


val 


ile 


pro 


val asp 


pro 


ala 


gly 


asp 


gly 


crl V 


leu 


met 


541/181 


















571/191 












GAC ATT 


GTG 


CTG 


TCG 


CCC 


ACC 


TAC 


TCG 


CAA 


GAC CGG 


CTG 


ATG 


TAC 


GCC 


TAC 


ATC 


AGC 


ACG 


asp ile 


val 


'leu 


ser 


pro 


thr 


tyr 


ser 


gin 


asp arg 


leu 


met 


tyr 


ala 


tyr 


ile 


ser 


thr 


601/201 


















631/211 














CCC ACC 


GAC 


AAC 


CGG 


GTG 


GTG 


CGA 


GTG 


GCC 


GAC GGC 


GAC 


ATC 


CCC 


AAG 


GAC 


ATC 


CTG 


ACC 


pro thr 


asp 


asn 


arg 


val 


val 


arg 


val 


ala 


asp gly 


asp 


ile 


pro 


lys 


asp 


ile 


leu 


thr 


661/221 


















691/231 












GGC ATC 


CCC 


AAA 


GGT 


GCT 


GCC 


GGT 


AAC 


ACC 


GGG GCG 


CTG 


ATC 


TTC 


ACC 


AGT 


CCC 


ACC 


ACG 


gly ile 


pro 


lys 


gly 


ala 


ala 


gly 


asn 


thr 


gly ala 


leu 


ile 


phe 


thr 


ser 


pro 


thr 


thr 


721/241 


















751/251 














CTG GTC 


GTG 


ATG 


ACC 


GGG 


GAT 


GCT 


GGC 


GAC 


CCG GCG 


TTG 


GCC 


GCC 


GAT 


CCC 


CAA 


TCG 


TTG 


leu val 


val 


met 


thr 


gly 


asp 


ala 


gly 


asp 


pro ala 


leu 


ala 


ala 


asp 


pro 


gin 


ser 


leu 


781/261 


















811/271 












GCC GGT 


AAG 


GTC 


CTG 


CGT 


ATC 


GAA 


CAG 


CCC 


ACC ACC 


ATC 


GGC 


CAG 


ACG 


CCG 


CCG 


ACG 


ACG 


ala gly 


lys 


val 


leu 


arg 


ile 


glu 


gin 


pro 


thr thr 


ile 


gly 


gin 


thr 


pro 


pro 


thr 


thr 


841/281 


















871/291 










GCG CTG 


TCT 


GGC 


ATC 


GGC 


TCC 


GGC 


GGC 


GGC 


TTG TGC 


ATC 


GAT 


CCG 


GTC 


GAC 


GGC 


TCG 


CTA 


ala leu 


ser 


gly 


ile 


gly 


ser 


gly 


gly 


gly 


leu cys 


ile 


asp 


pro 


val 


asp 


gly 


ser 


leu 


901/301 


















931/311 














TAT GTC 


GCC 


GAC 


CGC 


ACG 


CCA 


ACG 


GCG 


GAC 


CGA TTG 


CAG 


CGC 


ATC 


ACC 


AAG 


AAC 


TCG 


GAG 


tyr val 


ala 


asp 


arg 


thr 


pro 


thr 


ala 


asp 


arg leu 


gin 


arg 


ile 


thr 


lys 


asn 


ser 


glu 



SEQ ID N° 39F 
FIGURE 39F 



FEUILLE DE REMPLACEMENT (REGLE 26) 




WO 99/09186 § 1feP>CT/FR98/01813 

127/185 



961/321 991/331 

GTC TCT ACG GTA TGG ACC TGG CCG GAC AAG CCC GGC GTG GCC GGG TGT GCC GCG ATG GAC 

^nowo^ thr Vai trp thr trp Pr ° asp lys pro gly val ala cvs al * ala met asp 
1021/341 1051/351 

GGC ACC GTG CTG GTC AAC CTG ATT AAT ACC AAA CTG ACG GTG GCG GTC CGG CTC GCG CCG 
gly thr val leu val asn leu lie asn thr lys leu thr val ala val arg leu ala pro 
1061/361 1111/371 

TCG ACC GGT GCG GTC ACC GGA GAA CCC GAC GTT GTC CGC AAA GAC ACT CAT GCG CAT GCG 

???™, glY ala Val thr 9ly glU pr ° asp Val val ar * lys as P thr his ala his ala 
1141/381 1171/391 

TGG GCA TTA CGG ATG TCG CCG GAC GGC AAC GTC TGG GGA GCC ACC GTC AAC AAG ACC GCC 
trp ala leu arg met ser pro asp gly asn val trp gly ala thr val asn lys thr ala 
1201/401 1231/411 

GGC GAC GCC GAG AAG CTC GAC GAT GTG GTG TTC CCG CTG TTC CCG CAG GGT GGC GGC TTC 

126l/42i ala ^ PC ° 910 gly gly gly Phe 

CCG CGC AAC AAC GAC GAC AAG ACC TGA 
pro arg asn asn asp asp lys thr OPA 



SEQ ID N° 39F (suite) 
FIGURE 39F (suite) 



l/l 

GAA GGC CTT GTT GAG CCG GCG 

glu gly leu val glu pro ala 
61/21 

TCG GTT GAA CGT GTA TGT GCC 

ser val glu arg val cys ala 
121/41 

CGT CTC GGC GCT GAC TCA GGC 

arg leu gly ala asp ser gly 
181/61 

GTG GCT TGA GGG GTT GGA ACC 

val ala OPA gly val gly thr 
241/81 

GAT CGA TGC CGC TCG CGA TGA 

asp arg cys arg ser arg OPA 
301/101 

CAG GTG GTC GTC GAC GCG AGT 

gin val val val asp ala ser 









31/11 




CAC 


GAA 


AAC 


GAT CGT 


TGT 


his 


glu 


asn 


asp arg 


cys 








91/31 




CGA 


CGA 


ATT 


GGC GGA 


GCG 


arg 


arg 


ile 


gly gly 


ala 








151/51 




CGC 


GAT 


CAG 


TGC CGA 


GTT 


arg 


asp 


gin 


cys arg 


val 








211/71 




CAG 


AAG 


CAC 


CGG CGC 


TCG 


gin 


lys 


his 


arg arg 


ser 








271/91 




GTT 


CGA 


AGC 


GTG AGA 


GCA 


val 


arg 


ser 


val arg 


ala 








331/111 




GCC 


ATG 


GTG 


GAT C 




ala 


met 


val 


asp 





GTG TAC ATT GGT GTG TAT GGC 
val tyr ile gly val tyr gly 

CGC CAG GGC GCG GGG CTT GAA 
arg gin gly ala gly leu glu 

GGA GAA CTC CGC AAC CGA TGC 
gly glu leu arg asn arg cys 

GCA TGA TGA CGT GCT GGG TGC 
ala OPA OPA arg ala gly cys 

TCG CCC ACT TCG. CCG CCG GAG 
ser pro thr ser pro pro glu 



SEQ ID N° 4 OA 
FIGURE 4 OA 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 ^^»CT/FR98/01813 

128/185 



1/1 








31/11 
















AAG GCC TTG 


TTG AGC CGG CGC 


ACG AAA 


ACG 


ATC GTT GTG 


TGT 


ACA 


TTG 


GTG 


TGT 


ATG 


GCT 


lys ala leu 


leu ser arg arg thr lys 


thr 


ile val val 


cys 


thr 


leu 


Val 


cys 


met 


aia 


61/21 








91/31 












CGG TTG AAC 


GTG TAT GTG CCC 


GAC GAA 


TTG 


GCG GAG CGC 


GCC 


AGG 


GCG 


CGG 


GGC 


TTG 


AAC 


arg leu asn 


val tyr val pro asp glu 


leu 


ala glu arg ala arg ala 


arg 


gly 


leu 


asn 


121/41 








151/51 












GTC TCG GCG 


CTG ACT CAG GCC 


GCG ATC 


AGT 


GCC GAG TTG 


GAG 


AAC 


TCC 


GCA 


ACC 


GAT 


GCG 


val ser ala 


leu thr gin ala 


ala ile 


ser 


ala glu leu glu 


asn 


ser 


ala 


thr 


asp 


ala 


181/61 








211/71 












TGG CTT GAG 


GGG TTG GAA CCC 


AGA AGC 


ACC 


GGC GCT CGG 


CAT 


GAT 


GAC 


GTG 


CTG 


GGT 


GCG 


trp leu glu 


gly leu glu pro 


arg ser 


thr 


gly ala arg 


his 


asp 


asp 


val 


leu 


gly 


ala 


241/81 








271/91 












ATC GAT GCC 


GCT CGC GAT GAG 


TTC GAA 


GCG 


TGA GAG CAT 


CGC 


CCA 


CTT 


CGC 


CGC 


CGG 


AGC 


ile asp ala 


ala arg asp glu 


phe glu 


ala 


OPA glu his 


arg 


pro 


leu 


arg 


arg 


arg 


ser 


301/101 








331/111 








AGG TGG TCG 


TCG ACG CGA GTG 


CCA TGG 


TGG 


ATC 
















arg trp ser 


ser thr arg val 


pro trp 


trp 


ile 

















SEQ ID N° 40B 
FIGURE! 4 OB 



1/1 














31/11 
















AGG CCT 


TGT 


TGA GCC 


GGC 


GCA 


CGA AAA 


CGA 


TCG TTG 


TGT 


GTA CAT 


TGG 


TGT 


GTA 


TGG 


CTC 


arg pro 


cys 


.OPA ala gly 


ala 


arg lys 


arg 


ser leu 


cys 


val his 


trp 


cys 


val 


trp 


leu 


61/21 














91/31 










GGT TGA 


ACG 


TGT ATG 


TGC 


CCG 


ACG AAT 


TGG 


CGG AGC 


GCG 


CCA GGG 


CGC 


GGG 


GCT 


TGA 


ACG 


gly OPA thr 


cys met 


cys 


pro 


thr asn 


trp 


arg ser 


ala pro gly arg 


gly 


ala 


OPA 


thr 


121/41 














151/51 














TCT CGG 


CGC 


TGA CTC 


AGG 


CCG 


CGA TCA 


GTG 


CCG AGT 


TGG 


AGA ACT 


CCG 


CAA 


CCG 


ATG 


CGT 


ser arg 


arg 


OPA leu 


arg pro 


arg ser 


val 


pro ser 


trp 


arg thr 


pro 


gin 


pro 


met 


arg 


181/61 














211/71 








GGC TTG 


AGG 


GGT TGG 


AAC 


CCA 


GAA GCA 


CCG 


GCG CTC 


GGC 


ATG ATG 


ACG 


TGC 


TGG 


GTG 


CGA 


gly leu 


arg 


gly trp 


asn 


pro 


glu ala 


pro 


ala leu 


gly met met 


thr 


cys 


trp 


val 


arg 


241/81 














271/91 










TCG ATG 


CCG 


CTC GCG 


ATG 


AGT 


TCG AAG 


CGT 


GAG AGC 


ATC 


GCC CAC 


TTC 


GCC 


GCC 


GGA 


GCA 


ser met 


pro 


leu ala 


met 


ser 


ser lys 


arg 


glu ser 


ile 


ala his 


phe 


ala 


ala 


gly 


ala 


301/101 


























GGT GGT 


CGT 


CGA CGC 


GAG 


TGC 


CAT GGT 


GGA 


TC 
















gly gly arg 


arg arg glu cys his gly 


gly 



















SEQ ID N° 40C 
FIGURE 40C 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 




>CT/FR98/D1813 



129/185 



Sequence codante Rv054 9c predite par Cole et al., 1998 (Nature 393: 537-544 )et 
contenant seq40A 



1/1 






gtg aga 


gca 


teg 


val arg 


ala 


ser 


61/21 






gat eta 


ctg 


get 


asp leu 


leu 


ala 


121/41 






gcg atg 


cac 


gcg 


ala met 


his 


ala 


181/61 






cgc gcc 


ggc 


gca 


arg ala 


gly 


ala 


241/81 






ccg gtg 


act 


cga 


pro val 


thr 


arg 


301/101 






etc cgc 


ctg 


acc 


leu arg 


leu 


thr 


361/121 






acc ace 


gac 


gaa 


thr thr 


asp 


glu 



ccc act teg ccg 
pro thr ser pro 

cgc act age gat 
arg thr ser asp 

ccg gcg cac ttc 
pro ala his phe 

etc acc gtt gcc 
leu thr val ala 

cac ggt ctt teg 
his gly leu ser 

gat gcc etc tac 
asp ala leu tyr 

aga ttg gca cgc 
arg leu ala arg 







31/11 


ccg 


gag 


cag gtg 


pro 


glu 


gin val 






91/31 


egg 


tgc 


tct gcg 


arg 


cys 


ser ala 






151/51 


gat 


gca 


gag gtg 


asp 


ala 


glu val 






211/71 


tat 


gtc 


gat gcg 


tyr 


val 


asp ala 






271/91 


teg 


ctg 


ctt get 


ser 


leu 


leu ala 






331/111 


gtc 


gag 


ctg gcc 


val 


glu 


leu ala 






391/131 


gcc 


tgg 


ccc teg 


ala 


trp 


pro ser 



gtc gtc gac gcg 
val val asp ala 

gtg cgc gcg egg 
val arg ala arg 

ttg teg gcg ctg 
leu ser ala leu 

gca ctg gag gag 
ala leu glu glu 

gga gcg tgg teg 
gly ala trp ser 

gaa acg gca ggt 
glu thr ala gly 

get cac gcc ate 
ala his ala ile 



agt gcc atg gtg 
ser ala met val 

ctg get egg acc 
leu ala arg thr 

ggg cgc atg cag 
gly arg met gin 

ttg cga cag gtg 
leu arg gin val 

cgc cgc gac acc 
arg arg asp thr 

ctg gtg ttg ttg 
leu val leu leu 

ggc tga 
gly OPA 



SEQ ID N° 40D 



FIGURE 40D 



ORF d'apres 


Cole et 


al . , 


1998 (Nature 3 


1/1 


















tga gtt 
OPA val 
61/21 


cga 
arg 


age 
ser 


gtg 
val 


aga 
arg 


gca 
ala 


teg 
ser 


ccc 
pro 


act 
thr 


agt gcc 
ser ala 
121/41 


atg 
met 


gtg 
val 


gat 
asp 


eta 
leu 


ctg 
leu 


get 
ala 


cgc 
arg 


act 
thr 


ctg get 
leu ala 
181/61 


egg 
arg 


acc 
thr 


gcg 
ala 


atg 
met 


cac 
his 


gcg 
ala 


ccg 
pro 


gcg 
ala 


ggg cgc 
gly arg 
241/81 


atg 
met 


cag 
gin 


cgc 
arg 


gcc 
ala 


ggc 
gly 


gca 
ala 


etc 

leu 


acc 
thr 


ttg cga 
leu arg 
301/101 


cag 
gin 


gtg 
val 


ccg 
pro 


gtg 
val 


act 
thr 


cga 
arg 


cac 
his 


ggt 
gly 


cgc cgc 
arg arg 
361/121 


gac 
asp 


acc 
thr 


etc 
leu 


cgc 
arg 


ctg 
leu 


acc 
thr 


gat 
asp 


gcc 
ala 


ctg gtg 
leu val 
421/141 


ttg 
leu 


ttg 
leu 


acc 
thr 


acc 
thr 


gac 
asp 


gaa 
glu 


aga 
arg 


ttg 
leu 


ggc tga 
gly OPA 



















: 537-544) et contenant Rv0549c 



31/11 


















teg ccg 
ser pro 
91/31 


ccg 
pro 


gag 
glu 


cag 
gin 


gtg 
val 


gtc 
val 


gtc 
val 


gac 
asp 


gcg 
ala 


age gat 
ser asp 
151/51 


egg 
arg 


tgc 
cys 


tct 
ser 


gcg 
ala 


gtg 
val 


cgc 
arg 


gcg 
ala 


egg 
arg 


cac ttc 
his phe 
211/71 


gat 
asp 


gca 
ala 


gag 
glu 


gtg 
val 


ttg 
leu 


teg 
ser 


gcg 
ala 


ctg 
leu 


gtt gcc 
val ala 
271/91 


tat 
tyr 


gtc 
val 


gat 
asp 


gcg 
ala 


gca 
ala 


ctg 
leu 


gag gag 
glu glu 


ctt teg 
leu ser 
331/111 


teg 
ser 


ctg 
leu 


ctt 
leu 


get 
ala 


gga 
gly 


gcg 
ala 


tgg 
trp 


teg 
ser 


etc tac 
leu tyr 
391/131 


gtc 
val 


gag 
glu 


ctg 
leu 


gcc 
ala 


gaa 
glu 


acg 
thr 


gca 
ala 


ggt 
gly 


gca cgc 
ala arg 


gcc 
ala 


tgg 
trp 


ccc 
pro 


teg 
ser 


get 
ala 


cac 
his 


gcc 
ala 


ate 
ile 



SEQ ID N° 40F 
FEUILLE DE REMI^gEJIE^REGLE 26) 



WO 99/09186 




PCT/FR98/01813 



130/185 



1/1 
















31/11 










CCT GGC CGG 


GAC 


GCC 


TAC 


GTG 


TAG 


CCC 


GCG 


GCT AGC ACA GGA TAG CCA 


TTG 


TTG 


TGC 


GGT 


pro gly arg asp ala tyr val AMB 
61/21 


pro 


ala 


ala ser thr gly AMB pro 
91/31 


leu 


leu 


cys 


gly 


AGC GCC AAA ACG 


ATC 


AGC 


CCT 


TCG 


CGG 


ACA 


TGT CAG CAC CCG CCT TGG 


CCG 


GGA 


GAG 


CGG 


ser ala lys 


thr 


ile 


ser 


pro 


ser 


arg 


thr 


cys gin his pro pro trp 


pro 


gly 


glu 


arg 


121/41 
















151/51 




CGT CGT GAC 


CGT 


GCT 


GTC 


ACC 


ACG 


TCT 


GGT 


TAG GCT CGG GGC GCG GGC 


TGG 


CGC 


GGA 


GGA 


arg arg asp 
181/61 


arg 


ala 


val 


thr 


thr 


ser gly 


AMB ala arg gly ala gly 
211/71 


trp 


arg 


gly 


gly 


GGT GTG TTG 


CGG AGG 


AGG 


TGT 


GTT 


GTA 


GTG 


GGG ACG GCG GAT CGG CCG 


TTG 


GAC 


GCC 


TCG 


gly val leu 


arg 


arg 


arg 


cys 


val 


val 


val 


gly thr ala asp arg pro 


leu 


asp 


ala 


ser 


241/81 
















271/91 








GCC TTG CGG 


GAC 


TGG 


GCA 


CAC 


GCC 


GTC 


GTC 


AGC GAT C 










ala leu arg 


asp 


trp 


ala 


his 


ala 


val 


val 


ser asp 











SEQ ID N° 41A 
FIGURE 41A 



1/1 












31/11 
















CTG GCC GGG ACG 


CCT ACG 


TGT 


AGC 


CCG 


CGG 


CTA GCA 


CAG GAT 


AGC 


CAT 


TGT 


TGT 


GCG 


GTA 


leu ala gly thr 


pro thr 


cys 


ser 


pro 


arg 


leu ala 


gin asp 


ser 


his 


cys 


cys 


ala 


val 


61/21 












91/31 








GCG CCA AAA CGA 


TCA GCC 


CTT 


CGC 


GGA 


CAT 


GTC AGC 


ACC CGC 


CTT 


GGC 


CGG 


GAG 


AGC 


GGC 


ala pro lys arg 
121/41 


ser ala 


leu 


arg 


gly 


his 


val ser 
151/51 


thr arg 


leu 


gly 


arg 


glu 


ser 


gly 


GTC GTG ACC GTG 


CTG TCA 


CCA 


CGT 


CTG 


GTT 


AGG CTC 


GGG GCG 


CGG 


GCT 


GGC 


GCG 


GAG 


GAG 


val val thr val 


leu ser 


pro 


arg 


leu 


val 


arg leu 


gly ala 


arg 


ala 


gly 


ala 


glu 


glu 


181/61 












211/71 










GTG TGT TGC GGA 


GGA GGT 


GTG 


TTG 


TAG 


TGG 


GGA CGG 


CGG ATC 


GGC 


CGT 


TGG 


ACG 


CCT 


CGG 


val cys cys gly gly gly val leu 
241/81 


AMB 


trp 


gly arg 
271/91 


arg ile gly arg 


trp 


thr 


•pro 


arg 


CCT TGC GGG ACT 


GGG CAC 


ACG 


CCG 


TCG 


TCA 


GCG ATC 
















pro cys gly thr 


gly his 


thr 


pro 


ser 


ser 


ala ile 

















SEQ ID N° 4 IB 
FIGURE 41B 



FEUILLE DE (^EMPLACEMENT (REGLE 26) 



WO 99/09186 ^^>CT/FR98/01813 

131/185 



1/1 










TGG CCG 


GGA 


CGC 


CTA 


CGT 


trp pro 


gly 


arg 


leu 


arg 


61/21 








CGC CAA 


AAC 


GAT 


CAG 


CCC 


arg gin 


asn 


asp 


gin 


pro 


121/41 










TCG TGA 


CCG 


TGC 


TGT 


CAC 


ser OPA 


pro 


cys 


cys 


his 


181/61 










TGT GTT 


GCG 


GAG 


GAG 


GTG 


cys val 


ala 


glu 


glu 


val 


241/81 










CTT GCG 


GGA 


CTG 


GGC 


ACA 


leu ala 


gly 


leu 


gly 


thr 



31/11 
TAG CAC 
AMB his 
91/31 
TCA GCP 
ser ala 
151/51 
GGC TCG 
gly ser 
211/71 
GAC GGC 
asp gl^ 
271/91 



ATT 


GTT 


GTG 


CGG 


TAG 


ile 


val 


val 


arg 


AMB 


GCC 


GGG 


AGA 


GCG 


GCG 


ala 


gly 


arg 


ala 


ala 


CTG 


GCG 


CGG 


AGG 


AGG 


leu 


ala 


arg 


arg 


arg 


GTT 


GGA 


CGC 


CTC 


GGC 


val 


gly 


arg 


leu 


gly 



SEQ ID N° 41C 
FIGURE 41C 



Sequence codante Rv2975c predite par Cole et al, 1998 {Nature 393: 537-544) et 
contenant seq41A 

i' 1 31/11 



gtg ggg 


a eg 


gcg 


gat 


egg 


ccg 


ttg 


gac 


gec 


teg gec 


val gly 


thr 


ala 


asp 


arg 


pro 


leu 


asp 


ala 


ser ala 


61/21 


















91/31 


gtc age 


gat 


ctg 


ate 


etc 


cac 


ate 


gac 


gag 


ate aac 


val ser 


asp 


leu 


ile 


leu 


his 


ile 


asp 


glu 


ile asn 


121/41 














151/51 


gac tec 


gat 


acc 


ggc 


gtc 


aac 


atg 


ctg 


ttc 


acc atg 


asp ser 


asp 


thr 


gly 


val 


asn 


met 


leu 


phe 


thr met 


181/61 
















211/71 


ttg cac 


gcg 


aat 


teg 


cag 


get 


gac 


gec 


gaa 


gac gtg 


leu his 


ala 


asn 


ser 


gin 


ala 


asp 


ala 


glu 


asp val 


241/81 


















gec ggc 


gcg 


cgt 


tga 














ala gly 


ala 


arg 


OPA 















egg 


etc 


aat 


gtg 


ttc 


ccg 


gtc 


get 


arg 


leu 


asn 


val 


phe 


pro 


val 


ala 


cgt 


gec 


gcg 


gtc 


gta 


gaa 


get 


gat 


arg 


ala 


ala 


val 


val 


glu 


ala 


asp 


gcg 


egg 


gtt 


gcg 


gec 


get 


etc 


gcg 


ala 


arg 


val 


ala 


ala 


ala 


leu 


ala 



SEQ ID N° 41D 
FIGURE 41D 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



132/185 



ORF d'apres 


Cole et 


al, 


1998 (Nature 393: 537-544) et eontenant 


Rv2975c 






1/1 


















31/11 


















tag get 
AMB ala 
61/21 


egg 
arg 


ggc 
gly 


gcg 
ala 


ggc 


tgg 
trp 


cgc 
arg 


gga 
gly 


gga 
gly 


ggt gtg 
gly val 
91/31 


ttg 
leu 


egg 
arg 


agg 
arg 


agg 
arg 


tgt 
cys 


gtt 
val 


gta 
val 


gtg 
val 


ggg acg 
gly thr 
121/41 


gcg 
ala 


gat 
asp 


egg 
arg 


CCQ 

pro 


ttg 
leu 


gac 
asp 


gcc 
ala 


teg 
ser 


gee ttg 
ala leu 
151/51 


egg 
arg 


gac 
asp 


tgg 
trp 


gca 
ala 


cac 
his 


gcc 
ala 


gtc 
val 


gtc 
val 


age gat 
ser asp 
181/61 


ctg 
leu 


ate 
ile 


etc 
leu 


cac 
his 


ate 
ile 


gac 
asp 


gag 
glu 


ate 
ile 


aac egg 
asn arg 
211/71 


etc 
leu 


aat 
asn 


gtg 
vaX 


ttc 
phe 


ccg 
pro 


gtc 
val 


get 
ala 


gac 
asp 


tec gat 
ser asp 
241/81 


acc 
thr 


ggc 
gly 


gtc 
val 


aac 
asn 


atg 
met 


ctg 
leu 


ttc 
phe 


acc 
thr 


atg cgt 
met arg 
271/91 


gcc 
ala 


gcg 
ala 


gtc 
val 


gta 
val 


gaa 
glu 


get 
ala 


gat 
asp 


ttg 
leu 


cac gcg 
his ala 
301/101 


aat 
asn 


teg 
ser 


cag 
gin 


get 
ala 


gac 
asp 


gcc 
ala 


gaa 
glu 


gac 
asp 


gtg gcg 
val ala 


egg 
arg 


gtt 
val 


gcg 
ala 


gcc 
ala 


get 
ala 


etc 
leu 


gcg 
ala 


gcc 
ala 


ggc gcg 
gly ala 


cgt 
arg 


tga 
OPA 

































SEQ ID N° 4 IF 
FIGURE 41F 



sequence Rv 2974C predite par Cole et' 
dans la meme phase de lecture que Seq 
apparaitre dans un cas sur trois une 
phase bserve. dans 



1/1 


















ttg aac 
leu asn 
61/21 


gga 
gly 


get 
ala 


cgc 
arg 


ggc 
gly 


aac 
asn 


tec 
ser 


ggc 

gly 


gtg 
val 


gag gtg 
glu val 
121/41 


acc 
thr 


gcg 
ala 


act 
thr 


gcg 
ala 


gcc 
ala 


gcc 
ala 


gcc 
ala 


tct 
ser 


gcc etc 
ala leu 
181/61 


ggg 

gly 


gcc 

ala 


gcg 
ala 


ttg 
leu 


tgg 
trp 


cgc 
arg 


ggc 
gly 


gtc 
val 


gag gtg 
glu val 
241/81 


ccg 
pro 


gga 
gly 


act 
thr 


ate 
ile 


gtc 
val 


teg 
ser 


gtg 
val 


ctg 
leu 


gcg cac 
ala his 
301/101 


gag 
glu 


ggg 

gly 


ttg 
leu 


gcc 
ala 


ggt 
gly 


gcg 
ala 


gtc 
val 


acc 
thr 


gaa aag 
glu lys 


acc 
thr 


ccc 
pro 


gaa 

glu 


cag 
gin 


ctt 
leu 


gac 
asp 


gtg 
val 


etc 
leu 



al. (Nature 393:537-54 4) et pouvant etre 
UD. Le sequencage de cette region fait 
deletion de deux nucleotides mettant en 



31/11 


















ate ctg 
ile leu 
91/31 


tec 
ser 


cag 
gin 


ate 
ile 


ctg 
leu 


cgc 
arg 


ggg 

gly 


ate 
ile 


gca 
ala 


ggc gcg 
gly ala 
151/51 


gta 
val 


ttg 
leu 


egg 
arg 


gcg 

ala 


gtc 
val 


gac 
asp 


gcc 
ala 


aac 
asn 


gag ttg 
glu leu 
211/71 


gtc 
val 


gtc 
val 


gcg 
ala 


teg 
ser 


atg 
met 


ggt 
gly 


ggc 
gly 


gtg 
val 


egg gcc 
arg ala 
271/91 


gcc 
ala 


gcc 
ala 


gga 
gly 


gcc 
ala 


gtc 
val 


gac 
asp 


cag 
gin 


tgc 
cys 


gcc gcc 
ala ala 
331/111 


ggt 
gly 


gac 
asp 


gcg 
ala 


gcg 
ala 


gtc 
val 


ate 
ile 


gcg 
ala 


ctg 
leu 


gcc gat 
ala asp 


gcg 
ala 


ggc 
gly 


gcg 

ala 


gtg 
val 


gac 
asp 


gcc 
ala 


ggc 
gly 


gga 
gly 



SEQ ID N° 41S 



FIGURE 4 IS 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 




PCT/FR98/01813 



133/185 



361/121 








egg ggc 


ctg 


ctg 


gtt 


arg gly 


leu 


leu 


val 


421/141 








egg gcg 


gtc 


tac 


gaa 


arg ala 


val 


tyr 


glu 


481/161 






gec ccg 


caa 


ttc 


gag 


ala pro 


gin 


phe 


glu 


541/181 






ttg egg 


gat 


cga 


etc 


leu arg 


asp 


arg 


leu 


601/201 








age tac 


tec 


gta 


cac 


ser tyr 


ser 


val 


his 


661/221 








gtg ggg 


cga 


gtt 


age 


val gly 


arg 


val 


ser 


721/241 








gee ggt 


ggc 


tgg 


a eg 


ala gly 


gly 


trp 


thr 


781/261 








gag ctg 


ttc 


gee 


ggg 


glu leu 


phe 


ala 


gly 


841/281 








gee gee 


gat 


ate 


agt 


ala ala 


asp 


ile 


ser 


901/301 








gtg atg 


gtg 


ctg 


ccc 


val met 


val 


leu 


pro 


961/321 






gcg ate 


ggc 


tgg 


ggc 


ala ile 


gly 


trp 


gly 


1021/341 






gee gcg 


ctg 


gee 


gtg 


ala ala 


leu 


ala 


val 


1081/361 






cgt gec 


gec 


ggt 


get 


arg ala 


ala 


gly 


ala 


1141/381 




tgg gec 


ggt 


acc 


tgc 


trp ala gly 


thr 


cys 


1201/401 




gtc gee 


gac 


gat 


gtc 


val ala 


asp 


asp 


val 


1261/421 






ggc gat 


ctg 


gtg 


a eg 


gly asp 


leu 


val 


thr 


1321/441 






gaa egg 


cat 


gtg 


cac 


glu arg his 


val 


his 


1381/461 






cgc ggc 


gac 


gcg 


ctg 


arg gly 


asp 


ala 


leu 



ctg ctg gac gcg ttg 
leu leu asp ala leu 

ccc teg ccg cgc gcg 
pro ser pro arg ala 

gtg atg tat ctg ttg 
val met tyr leu leu 

aag gaa ttg ggt gag 
lys glu leu gly glu 

gtc cac acc gac gac 
val his thr asp asp 

egg ate gtg ate teg 
arg ile val ile ser 

egg ggc cgc gee gtg 
arg gly arg ala val 

gag ggc gec tgc gtg 
glu gly ala cys val 

gee cac cag ctg gtg 
ala his gin leu val 

aat ggc tat gtg gec 
asn gly tyr val ala 

gtc gac gtg gta ccc 
val asp val val pro 

cat gac gcg gee cgc 
his asp ala ala arg 

tec egg cac gga teg 
ser arg his gly ser 

aag ccg ggc gac ggt 
lys pro gly asp gly 

gee gcg gcg gee ate 
ala ala ala ala ile 

gtg eta att ggc gee 
val leu ile gly ala 

gac cac cat cca ggc 
asp his his pro gly 

ctg ate ggg gtc gag 
leu ile gly val glu 



391/131 






cgc tec acc 


ate 


tgc 


arg ser thr 


ile 


cys 


451/151 






ttg ccg acc 


gac 


acg 


leu pro thr 


asp 


thr 


511/171 






gcg gta tgt 


gat 


get 


ala val cys 


asp 


ala 


571/191 






teg gtg gec 


ate 


gec 


ser val ala 


ile 


ala 


631/211 






gec ggt gee 


gec 


gtg 


ala gly ala ala 


val 


691/231 






gcg etc ggt 


tec 


ggg 


ala leu gly 


ser 


gly 


751/251 






ctg gcg gtc 


gtc 


gac 


leu ala val 


val 


asp 


811/271 




ctg cga ccg 


ggt 


cca 


leu arg pro 


gly 


pro 


871/291 






egg gec gtg 


gta 


gac 


arg ala val 


val 


asp 


931/311 






gec gaa gaa 


ctg 


gtg 


ala glu glu 


leu 


val 


991/331 






gtg ccg acc 


gga 


teg 


val pro thr gly 


ser 


1051/351 






cag gec gtc 


gac 


gac 


gin ala val 


asp 


asp 


1111/371 






gtg cgc att 


gec 


acc 


val arg ile 


ala 


thr 


1171/391 






ctg ggt ate 


gcg 


ggc 


leu gly ile 


ala 


gly 


1231/411 






ggt ctg gtc 


gac 


ctg 


gly leu val 


asp 


leu 


1291/431 




ggc gta acc 


gaa 


gac 


gly val thr glu 


asp 


1351/451 






acc gag ctg 


gtc 


tec 


thr glu leu 


val 


ser 


1411/471 






tag 






AMB 







ggg cag gca cct gec 
gly gin ala pro ala 

get acc caa cgc ccc 
ala thr gin arg pro 

gca gcg gcg gac cag 
ala ala ala asp gin 

get get ccg ccc gac 
ala ala pro pro asp 

gaa gee gga ttg gcg 
glu ala gly leu ala 

acc age gga ttg ccg 
thr ser gly leu pro 

ggc gac ggt gee gec 
gly asp gly ala ala 

gac gee gtg aca ccg 
asp ala val thr pro 

acc ggc gee gcg cac 
thr gly ala ala his 

gee ggg tgt acc gcg 
ala gly cys thr ala 

atg gtg cag ggg ttg 
met val gin gly leu 

ggc tac age atg gec 
gly tyr ser met ala 

caa aag gcg ctg acc 
gin lys ala leu thr 

gac gag gtg ctg ate 
asp glu val leu ile 

ttg ttg gca teg gga 
leu leu ala ser gly 

gtg get gtc gtc ctg 
val ala val val leu 

tac cgc acc gga cac 
tyr arg thr gly his 



SEQ ID N° 41S (suite) 



FIGURE 41S (suite) 
FEU1LLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 




'CT/FR98/01813 



134/185 



Seq41T comprenant seq 41F et seq 41S 

1/1 31/11 

tta ggc teg ggg cgc ggg ctg gcg egg agg agg tgt gtt gcg gag gag gtg tgt tgt agt 
leu gly ser gly arg gly leu ala arg arg arg cys val ala glu glu val cys cys ser 
AMB ala arg gly ala gly trp arg gly gly gly val leu arg arg arg cys val val val 

arg leu gly ala arg ala gly ala glu glu val cys cys gly gly gly val leu AMB trp 
€1/21 91/31 

ggg gac ggc gga teg gec gtt gga cgc etc ggc ctt gcg gga ctg ggc aca cgc cgt cgt 
gly asp gly gly ser ala val gly arg leu gly leu ala gly leu gly thr arg arg arg 
gly thr ala asp arg pro leu asp ala ser ala leu arg asp trp ala his ala val val 
gly arg arg ile gly arg. trp thr pro arg pro cys gly thr gly his thr pro ser ser 
121/41 151/51 

cag cga tct gat cct cca cat cga cga gat caa ccg get caa tgt gtt ccc ggt cgc tga 
gin arg ser asp pro pro his arg arg asp gin pro ala gin cys val pro gly arg OPA 
ser asp leu ile leu his ile asp glu ile asn arg leu asn val phe pro val ala asp 
ala ile OPA ser ser thr ser thr arg ser thr gly ser met cys ser arg ser leu thr 
181/61 211/71 

etc cga tac egg cgt caa cat get gtt cac cat gcg tgc cgc ggt cgt aga age tga ttt 
leu arg tyr arg arg gin his ala val his his ala cys arg gly arg arg ser OPA phe 
ser asp thr gly val asn met leu phe thr met arg ala ala val val glu ala asp leu 
pro ile pro ala ser thr cys cys ser pro cys val pro arg ser AMB lys leu ile cys 
241/81 271/91 

gca cgc gaa ttc gca ggc tga cgc cga aga cgt ggc gcg ggt tgc ggc cgc tct cgc ggc 
ala arg glu phe ala gly OPA arg arg arg arg gly ala gly cys gly arg ser arg gly 
his ala asn ser gin ala asp ala glu asp val ala arg val ala ala ala leu ala ala 
thr arg ile arg arg leu thr pro lys thr trp arg gly leu arg pro leu ser arc pro 
301/101 331/111 

egg cgc gcg ttg aac gga get cgc ggc aac tec ggc gtg ate ctg tec cag ate ctg cgc 
arg arg ala leu asn gly ala arg gly asn ser gly val ile leu ser gin ile leu arg 
gly ala arg OPA thr glu leu ala ala thr pro ala OPA ser cys pro arg ser cys ala 
ala arg val glu arg ser ser arg gin leu arg arg asp pro val pro asp pro ala arq 
361/121 391/131 

ggg ate gca gag gtg ace gcg act gcg gee gee gec tct ggc gcg gta ttg egg gcg gtc 
gly ile ala glu val thr ala thr ala ala ala ala ser gly ala val leu arg ala val 
gly ser gin arg OPA pro arg leu arg pro pro pro leu ala arg tyr cys gly arg ser 
asp arg arg. gly asp arg asp cys gly arg arg leu trp arg gly ile ala gly gly arc 
421/141 451/151 

gac gec aac gec etc ggg gec gcg ttg tgg cgc ggc gtc gag ttg gtc gtc gcg teg atg 
asp ala asn ala leu gly ala ala leu trp arg gly val glu leu val val ala ser met 
thr pro thr pro ser gly pro arg cys gly ala ala ser ser trp ser ser arg arg tro 

48i/i6i ln arg pr ° arg 9ly arg val val aXaarg arg arg val gly arg arg val as P giy 

ggt ggc gtg gag gtg ccg gga act ate gtc teg gtg ctg egg gec gee gec gga gec gtc 
gly gly val glu val pro gly thr ile val ser val leu arg ala ala ala gly ala val 
val ala trp arg cys arg glu leu ser ser arg cys cys gly pro pro pro glu pro ser 

c.w? a arg gly gly Ua 9ly aSn tyr arg leu gly ala ala 9 lv ar <3 *rg ser arg arg 
541/181 S71/191 

gac cag tgc gcg cac gag ggg ttg gec ggt gcg gtc acc gee gec ggt gac gcg gcg gtc 
asp gin cys ala his glu gly leu ala gly ala val thr ala ala gly asp ala ala val 
thr ser ala arg thr arg gly trp pro val arg ser pro pro pro val thr arg arg ser 
pro val arg ala arg gly val gly arg cys gly his arg arg arg OPA arg gly gly his 
601/201 631/211 

ate gcg ctg gaa aag acc ccc gaa cag ctt gac gtg etc gec gat gcg ggc gcg gtg gac 
ile ala leu glu lys thr pro glu gin leu asp val leu ala asp ala gly ala val asp 
ser arg trp lys arg pro pro asn ser leu thr cys ser pro met arg ala arg trp th- 

^w^i la gly lyS aSP Pr ° arg thr aia ° PA aEg ala arg arg c * a gi y a rg gly gly arg 
661/221 691/231 

gec ggc gga egg ggc ctg ctg gtt ctg ctg gac gcg ttg cgc tec acc ate tgc ggg cag 
ala gly gly arg gly leu leu val leu leu asp ala leu arg ser thr ile cys gly gin 
pro ala asp gly ala cys trp phe cys trp thr arg cys ala pro pro ser ala glv arg 
arg arg thr gly pro ala gly ser ala gly arg val ala leu his his leu arg ala gly 

SEQ ID N° 41T 



FEU1LLE DE REWf^SgM&tf (REGLE 26) 



WO 99/09186 




PCT/FR98/01813 



135/185 



721/241 751/251 

gca cct gcc egg gcg gtc tac gaa ccc teg ccg cgc gcg ttg ccg acc gac acg get acc 
ala pro ala arg ala val tyr glu pro ser pro arg ala leu pro thr asp thr ala thr 
his leu pro gly arg ser thr asn pro arg arg ala arg cys arg pro thr arg leu pro 
thr cys pro gly gly leu arg thr leu ala ala arg val ala asp arg his gly tyr pro 
781/261 611/271 

caa cgc ccc gcc ccg caa ttc gag gtg atg tat ctg ttg gcg gta tgt gat get gca gcg 
gin arg pro ala pro gin phe glu val met tyr leu leu ala val cys asp ala ala ala 
asn ala pro pro arg asn ser arg OPA cys ile cys trp arg tyr val met leu gin arg 

— ?J!L pro arg PX ° ala iie arg gly a3p val ser val Sly Sly met OPA cys cys ser gly 
841/281 871/291 ~ 

gcg gac cag ttg egg gat cga etc aag gaa ttg ggt gag teg gtg gcc ate gcc get get 
ala asp gin leu arg asp arg leu lys glu leu gly glu ser val ala ile ala ala ala 
arg thr ser cys gly ile asp ser arg asn trp val ser arg trp pro ser pro leu leu 

901/30i r ° ^ ^ ° PA 9ly 9ly hiS arg arg CyS Ser 

ccg ccc gac age tac tec gta cac gtc cac acc gac gac gcc ggt gcc gcc gtg gaa gcc 
pro pro asp ser tyr ser val his val his thr asp asp ala gly ala ala val glu ala 
arg pro thr ala thr pro tyr thr ser thr pro thr thr pro val pro pro trp lys pro 

o, al , a o arg gln l6U leU arg thr arg pro his arg ar * ar 9 arg cys arg arg gly ser arg 
961/321 991/331 

gga ttg gcg gtg ggg cga gtt age egg ate gtg ate teg gcg etc ggt tec ggg acc age 
gly leu ala val gly arg val ser arg ile val ile ser ala leu gly ser gly thr ser 
asp trp arg trp gly glu leu ala gly ser OPA ser arg arg ser val pro gly pro ala 

1021/341* M PrC> ar i051/35i U ^ ^ ^ *** a3P gl " aXg 

gga ttg ccg gcc ggt ggc tgg acg egg ggc cgc gcc gtg ctg gcg gtc gtc gac ggc gac 
gly leu pro ala gly gly trp thr arg gly arg ala val leu ala val val asp gly a3 p 
asp cys arg pro val ala gly arg gly ala ala pro cys trp arg ser ser thr ala thr 

,«:;!*5: a gly arg trp leu asp ala gly pro arg arg ala ^y w ar * ar * a rg ar g «g 

1081/361 1111/371 

ggt gcc gcc gag ctg ttc gcc ggg gag ggc gcc tgc gtg ctg cga ccg ggt cca gac gee 
gly ala ala glu leu phe ala gly glu gly aid cys val leu arg pro gly pro asp ala 
val pro pro ser cys ser pro gly arg ala pro ala cys cys asp arg val gin thr pro 

,,?^. a f g arg ala Val arg arg gly gly arg leu arg ala ala thr gly ser arg arg arg 
1141/381 1171/391 

gtg aca ccg gcc gcc gat ate agt gcc cac cag ctg gtg egg gcc gtg gta gac acc ggc 
val thr pro ala ala asp ile ser ala his gin leu val arg ala val val asp thr gly 
OPA his arg pro pro ile ser val pro thr ser trp cys gly pro trp AMB thr pro ala 

nSyLS?* aXg ^ tyr gln CyS Pr ° Pr ° ala gly ala *V ar 9 gly arg his arg arg 
1201/401 1231/411 

gcc gcg cac gtg atg gtg ctg ccc aat ggc tat gtg gcc gcc gaa gaa ctg gtg gcc ggg 
ala ala his val met val leu pro asn gly tyr val ala ala glu glu leu val ala gly 
pro arg thr OPA trp cys cys pro met ala met trp pro pro lys asn trp trp pro gly 

arg dSP 9ly 3la ala gln trp leU cys gly arg ar * thr gly gly arg val 
1261/421 1291/431 

tgt acc gcg gcg ate ggc tgg ggc gtc gac gtg gta ccc gtg ccg acc gga teg atg gtg 
cys thr ala ala ile gly trp gly val asp val val pro val pro thr gly ser met val 
val pro arg arg ser ala gly ala ser thr trp tyr pro cys arg pro asp arg trp cys 

,J% r ,A r , g 9 y a3P arg leU gly arg arg arg gly thr arg ala as P ar 9 il« a ^P gly ala 
1321/441 1351/451 

cag ggg ttg gcc gcg ctg gcc gtg cat gac gcg gcc cgc cag gcc gtc gac gac ggc tac 
gln gly leu ala ala leu ala val his asp ala ala arg gln ala val asp asp gly ty- 
arg gly trp pro arg trp pro cys met thr arg pro ala arg pro ser thr thr ala thr 

9 7 ^ ala gIy arg ala ° PA arg gly pro P ro glv arg arg ar g arg leu gln 
1331/461 1411/471 

age atg gcc cgt gcc gcc ggt get tec egg cac gga teg gtg cgc att gcc acc caa aag 
ser met ala arg ala ala gly ala ser arg his gly ser val arg ile ala thr gln lys 
ala trp pro val pro pro val leu pro gly thr asp arg cys ala leu pro pro lys arg 
his gly pro cys arg arg cys phe pro ala arg ile gly ala his cys his pro lys gly 



SEQ ID N° 41T (suite 1) 



FEUILLE dfflJ8U§ff$^ 26) 



WO 99/09186 ^PPCT/FR98/01813 

136/185 



1441/481 1471/491 

gcg ctg acc tgg gcc ggt acc tgc aag ccg ggc gac ggt ctg ggt ate gcg ggc gac gag 
ala leu thr trp ala gly thr cys lys pro gly asp gly leu gly ile ala gly asp glu 
arg OPA pro gly pro val pro ala ser arg ala thr val trp val ser arg ala thr arg 

ala asp leu gly arg tyr leu gin ala gly arg arg ser gly tyr arg gly arg arg gly 
1501/501 1531/511 

gtg ctg ate gtc gcc gac gat gtc gcc gcg gcg gcc ate ggt ctg gtc gac ctg ttg ttg 
val leu ile val ala asp asp val ala ala ala ala ile gly leu val asp leu leu leu 
cys OPA ser ser pro thr met ser pro arg arg pro ser val trp ser thr cys cys trp 
ala asp arg arg arg arg cys arg arg gly gly his arg ser gly arg pro val val gly 
1561/521 1591/531 

gca teg gga ggc gat ctg gtg acg gtg eta att ggc gcc ggc gta acc gaa gac gtg get 
ala ser gly gly asp leu val thr val leu ile gly ala gly val thr glu asp val ala 
his arg glu ala ile trp OPA arg cys OCH leu ala pro ala OCH pro lys thr trp leu 
ile gly arg arg ser gly asp gly ala asn trp arg arg arg asn arg arg arg gly cys 
1621/541 1651/551 

gtc gtc ctg gaa egg cat gtg cac gac cac cat cca ggc acc gag ctg gtc tec tac cgc 
val val leu glu arg his val his asp his his pro gly thr glu leu val ser tyr arg 
ser ser trp asn gly met cys thr thr thr ile gin ala pro ser trp ser pro thr ala 
arg pro gly thr ala cys ala arg pro pro ser arg his arg ala gly leu leu pro his 
1681/561 1711/571 
acc gga cac cgc ggc gac gcg ctg ctg ate ggg gtc gag tag 
thr gly his arg gly asp ala leu leu ile gly val glu AMB 
pro asp thr ala ala thr arg cys OPA ser gly ser ser 
arg thr pro arg arg arg ala ala asp arg gly arg val 



SEQ ID N° 41T (suite 2) 
FIGURE 41T (suite 2) 



1/1 
















31/11 
















GCC GGT 


AAC 


GCC 


GCG 


TCC CAG 


TGC 


TAT 


CCG 


TCC GCC 


GGA 


CCG 


CCC GAA 


ACA 


TCA 


GCG 


GCG 


ala gly 


asn 


ala 


ala 


ser gin 


cys 


tyr 


pro 


ser ala 


gly 


pro 


pro glu 


thr 


ser 


ala 


ala 


61/21 
















91/31 














GGC GCC 


CCG 


GTC 


GGC 


CGC GGC 


CGG 


GCT 


CGA 


CCC GCT 


CCA 


CCT 


GGC CAT 


CAG 


CGA 


CCA 


GGT 


gly ala 
121/41 


pro 


val 


gly 


arg gly 


arg 


ala 


arg 


pro ala 
151/51 


pro 


pro 


gly his 


gin 


arg 


pro 


gly 


TAT CGA 


GGT 


GGA 


AGC 


GGA CGG 


TGT 


TGG 


GAT 


GCA CGC 


CCA 


ACT 


TGC CGG 


CGA 


TCG 


CGG 


CGA 


tyr arg 
181/61 


gly 


gly 


ser 


gly arg 


cys 


trp 


asp 


ala arg 
211/71 


pro 


thr 


cys arg 


arg 


ser 


arg 


arg 


TGC TCA 


TCG 


GAA 


CCC 


GCG ACG 


CAC 


ACA 


ATG 


CCC GCA 


GCA 


CCG 


CAC GAC 


GGC 


GCC 


CCA 


CCG 


cys ser 


ser 


glu 


pro 


ala thr 


his 


thr 


met 


pro ala 


ala 


pro 


his asp 


gly 


ala 


pro 


pro 


241/81 
















271/91 








GCT CTT 


GCA 


GTG 


ACC 


TGA TGA 


TGA 


CAC 


TCA 


CCC CCA 


TAA 


GGC 


TCG TCG 


GCT 


GCG 


CCT 


GAG 


ala leu 


ala 


val 


thr 


OPA OPA 


OPA 


his 


ser 


pro pro 


OCH 


gly 


ser ser 


ala 


ala 


pro 


glu 


301/101 
















331/111 










CAA TGC 


AGT 


AAG 


TTT 


ACA CAA 


ACG 


GAC 


TTG 


TAA AAA 


CCT 


GCG 


GAG GTG 


GGG 


TCT 


ATG 


GCC 


gin cys 


ser 


lys 


phe 


thr gin 


thr 


asp 


leu 


OCH lys 


pro 


ala 


glu val 


gly 


ser 


met 


ala 


361/121 
















391/131 










AAC AAA 


CGT 


GGC 


AAT 


GCC GGG 


CAG 


CCT 


CTG 


CCC TTG 


TCG 


GAT 


C 










asn lys 


arg 


gly 


asn 


ala gly 


gin 


pro 


leu 


pro leu 


ser 


asp 













SEQ ID N° 42A 



FIGURE 42A 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 




PCT/FR98/01813 



137/185 



1 

1/1 31/11 

CCG GTA ACG CCG CGT CCC AGT GCT ATC CGT CCG CCG GAC CGC CCG AAA CAT CAG CGG CGG 

61/21 " g |f/ 3 ? r0 aSP Pr ° lyS his « lB ar ? «9 

GCG CCC CGG TCG GCC GCG GCC GGG CTC GAC CCG CTC CAC CTG GCC ATC AGC GAC CAG GTT 

ala pro arg ser ala ala ala gly leu asp pro leu his leu ala ile ser asp gin val 

121/41 151/51 

ATC GAG GTG GAA GCG GAC GGT GTT GGG ATG CAC GCC CAA CTT GCC GGC GAT CGC GGC GAT 

181/li U V ^ 917 aSP 9ly aSp 

GCT CAT CGG AAC CCG CGA CGC ACA CAA TGC CCG CAG CAC CGC ACG ACG GCG CCC CAC CGG 

241/81* 3311 ar9 3rg ^ P n 9l " hlS ar9 thC tht ala pr ° his "9 

CTC TTG CAG TGA CCT GAT GAT GAC ACT CAC CCC CAT AAG GCT CGT CGG CTG CGC CTG AGC 

™?/}n? 9 Pt ° aSP aSP 3SP tht hiS Pt ° his lys ala arg leu arg leu ser 

JUl/lQl 331/111 

AAT GCA GTA AGT TTA CAC AAA CGG ACT TGT AAA A*C CTG CGG AGG TGG GGT CTA TGG CCA 

tllAl, *" h " lyS aCg thC CyS lyS aSn leu ar 9 ar 9 trp gly leu trp nro 

Jbl/lZl 391/131 

ACA AAC GTG GCA ATG CCG GGC AGC CTC TGC CCT TGT CGG ATC 

thr asn val ala met pro gly ser leu cys pro cys arg ile 



SEQ ID N° 42B 



FIGURE 42B 



1/1 31/11 

ITa Sit ^ GT ? f A TCC GTC CG ° CGG ACC GCC CGA *M ATC AGC GGC GGG 

arg^OCH arg arg val pro val leu ser val arg^arg thr ala arg asn ile ser gly gly 

CGC CCC GGT CGG CCG CGG CCG GGC TCG ACC CGC TCC ACC TGG CCA TCA GCG ACC AGG TTA 
arg pro gly arg pro arg pro gly ser thr arg se r thr trp pro ser ala thr arg leu 
121/41 151/51 y 

TCG AGG TGG AAG CGG ACG GTG TTG GGA TGC ACG CCC AAC TTG CCG GCG ATC GCG GCG ATG 

i e i C / a f lyS arg l6U 917 CyS thC P " asn leu pro ala al * ala met 

181/61 211/71 

CTC ATC GGA ACC CGC GAC GCA CAC AAT GCC CGC AGC ACC GCA CGA CGG CGC CCC ACC GGC 

leu^ile gly thr arg asp ala his asn ala arg^er thr ala arg arg arg pro thr gty 

TCT TGC AGT GAC CTG ATG ATG ACA CTC ACC CCC ATA AGG CTC GTC GGC TGC GCC TGA GCA 
301/101 aSP P 3°^^ 3rg 1CU Val ^ ly c * s ala °™ ala 

ATG CAG TAA GTT TAC ACA AAC GGA CTT GTA AAA ACC TGC GGA GGT GGG GTC TAT GGC CAA 

Tei/lll ° CH tyr thr aSn 9ly leU Val 1*1,1*1 cys gly giy * ly val S. gly g™ 

CAA ACG TGG CAA TGC CGG GCA GCC TCT GCC CTT GTC GGA TC 
gin thr trp gin cys arg ala ala ser ala leu val gly 



SEQ ID N° 42C 



FIGURE A2C 
FEU1LLE DE REMPLACEMENT {REGLE 26) 



WO 99/09186 




'CIYFR98/01813 



138/185 



Sequence codante Rv2622 predite par Cole et al., 1998 (Nature 393:537-544) et 
contenant seq42A: 



1/1 31/11 



atg gcc 


aac 


aaa 


cgt 


ggc 


aat 


gcc 


ggg 


cag cct ctg 


ccc 


ttg 


teg 


qat 


cqa 


aac 


aac 


gac 


Met ala 


asn 


lys 


arg 


gly 


asn 


ala 


gly 


gin pro leu 


pro 


leu 


ser 


asp 


arq 


asp 


asp 


aso 


61/21 
















91/31 










cac atg 


cag 


ggg 


cac 


tgg 


ctg 


ctg 


gcc 


egg ctg ggc 


aag 


cqq 


Qtcr 


eta 


cgt 


ccc 




arte 
yg<* 


his met 


gin 


gly 


his 


trp 


leu 


leu 


ala 


arg leu gly 


lys 


arg 


val 


leu 


arg 


pro 


alv 


alv 
y * j 


121/41 
















151/51 










gtc gaa 


etc 


acc 


egg 


aca 


ctg 


ctg 


gcc 


cgc gcc gag 


gtg 


acc 


gac 


gcc 


qac 


qtq 


etc 


aaa 
y°y 


val glu 


leu 


thr 


arg 


thr 


leu 


leu 


ala 


arg ala glu 


val 


thr 


asp 


ala 


asp 


val 


leu 


glu 


181/61 
















211/71 












ctg gca 


ccg 


ggc 


ctg 


ggc 


cgc 


acc 


gca 


gcc gaa ate 


ttg 


gcc 


cgc 


aac 


ccc 


caa 


tea 


tac 


leu ala 


pro 


gly 


leu 


gly 


arg 


thr 


ala 


ala glu ile 


leu 


ala 


arg 


asn 


pro 


arq 


ser 


tvr 


241/81 
















271/91 










gtg ggg 


gcg 


gag 


age 


gat 


ccc 


aac 


gcg 


gcc aac ctg 


gtc 


cga 


cac 


qtt 


etc 


gcc 


aac 
y y 




val gly 


ala 


glu 


ser 


asp 


pro 


asn 


ala 


ala asn leu 


val 


arg 


his 


val 


leu 


ala 


alv 
y * j 


a rg 


301/101 
















331/111 














ggc gac 


gtc 


egg 


gtc 


acc 


gac 


gcg 


gcc 


gat acc gga 


tta 


tec 


aac 


qcc 


aac 


acc 


gat 


gtc 


gly asp 


val 


arg 


val 


thr 


asp 


ala 


ala 


asp thr gly 


leu 


ser 


asp 


ala 


ser 


ala 


asp 


val 


361/121 
















391/131 












gtc ate 


ggc 


gag 


gcg 


atg 


ctg 


acc 


atg 


caa ggc aac 


gcg 


get 


aaa 


cac 


aca 


ate 


ate 


y^^ 


val ile 


gly 


glu 


ala 


met 


leu 


thr 


met 


gin gly asn 


ala 


ala 


lys 


his 


thr 


ile 


val 


ala 


421/141 
















451/151 














gag gcg 


gcg 


egg 


gtg 


ctg 


agg 


ccg 


ggt 


ggc cgc tac 


gcg 


att 


cac 


gaa 


eta 


aca 


eta 


at a 
y *-y 


glu ala 


ala 


arg 


val 


leu 


arg 


pro 


gly 


gly arg tyr 


ala 


ile 


his 


glu 


leu 


ala 


leu 


val 


481/161 
















511/171 
















ccg gac 


gac 


gtc 


gca 


gag 


cag 


gtc 


cgc 


acc gac ctg 


egg 


cag 


teg 


ctg 


gcc 


cgc 


gcg 


etc 


pro asp 


asp 


val 


ala 


glu 


gin 


val 


arg 


thr asp leu 


arg 


gin 


ser 


leu 


ala 


arg 


ala 


leu 


541/181 
















571/191 
















aag gtc 


aat 


gcg 


cgt 


ccg 


ctg 


acc 


gtt 


gcg gaa tgg 


teg 


cac 


etc 


tta 


gcg 


ggc 


cat 


gga 


lys val 


asn 


ala 


arg 


pro 


leu 


thr 


val 


ala glu trp 


ser 


his 


leu 


leu 


ala 


gly 


his 


gly 


601/201 
















631/211 














ctg gtc 


gtc 


gaa 


cac 


gtt 


gtc 


acc 


get 


tec atg gcg 


ttg 


tta 


caa 


ccg 


cga 


egg 


gtg 


ate 


leu val 


val 


glu 


his 


val 


val 


thr 


ala 


ser met ala 


leu 


leu 


gin 


pro 


arg 


arg 


val 


ile 


661/221 
















691/231 










get gac 


gaa 


ggc 


etc 


ctg 


ggt 


gcg 


ctg 


egg ttc gcc 


gga 


aac 


ctg 


etc 


ate 


cat 


cgt 


gcc 


ala asp 


glu 


gly 


leu 


leu 


gly 


ala 


leu 


arg phe ala 


gly 


asn 


leu 


leu 


ile 


his 


arg 


ala 


721/241 
















751/251 














gcg cgt 


egg 


cga 


gtc 


ctg 


ttg 


atg 


cgc 


cac aca ttc 


cgc 


agg 


cat 


cgt 


gaa 


cgc 


ttg 


aca 


ala arg 


arg 


arg 


val 


leu 


leu 


met 


arg 


his thr phe 


arg 


arg 


his 


arg 


glu 


arg 


leu 


thr 


781/261 
















811/271 












gcc gtc 


gcc 


att 


gtc 


gcg 


cac 


aaa 


ccg 


cac gtc gat 


teg 


tga 














ala val 


ala 


ile 


val 


ala 


his 




pro 


his val asp 


ser 


OPA 















SEQ ID N° 42D 
FIGURE 42D 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 




PCT/FR98/01813 



139/185 



ORF d'apres Cole et al., 1998 (Nature 



1/1 



taa aaa 
OCH lys 
61/21 


cct 
pro 


gcg 
ala 


gag 
glu 


gtg 
val 


ggg 
gly 


tct 
ser 


atg 
met 


gcc 
ala 


ccc ttg 
pro leu 
121/41 


teg 
ser 


gat 
asp 


cga 
arg 


gac 
asp 


gac 
asp 


gac 
asp 


cac 
his 


atg 
met 


aag egg 
lys arg 
181/61 


gtg 
val 


ctg 
leu 


cgt 
arg 


ccc 
pro 


ggc 
gly 


ggc 
gly 


gtc 
val 


gaa 
glu 


gtg acc 
val thr 
241/81 


gac 
asp 


gcc 
ala 


gac 
asp 


gtg 
val 


etc 
leu 


gag 
glu 


ctg 
leu 


gca 
ala 


ttg gcc 
leu ala 
301/lOi 


cgc 
arg 


aac 
asn 


ccg 
pro 


egg 
arg 


teg 
ser 


tac 
tyr 


gtg 
val 


ggg 

gly 


gtc cga 
val arg 
361/121 


cac 
his 


gtt 
val 


etc 
leu 


gcc 
ala 


ggc 
gly 


cgc 
arg 


ggc 
gly 


gac 
asp 


tta tec 
leu ser 
421/141 


gac 
asp 


gcc 
ala 


age 
ser 


gcc 
ala 


gat 
asp 


gtc 
val 


gtc 
val 


ate 
ile 


gcg get 
.ala ala 
481/161 


aaa 
lys 


cac 
his 


a eg 
thr 


ate 
ile 


gtc 
val 


gcc 
ala 


gag 
glu 


gcg 
ala 


gcg att 
ala ile 
541/181 


cac 
his 


gaa 
glu 


eta 
leu 


gcg 
ala 


ctg 
leu 


gtg 
val 


ccg 
pro 


gac 
aso 


egg cag 
arg gin 
601/201 


teg 
ser 


ctg 
leu 


gcc 
ala 


cgc 
arg 


acq 
ala 


etc 
leu 


aaa 
lys 


ate 
val 


teg cac 
ser his 
661/221 


etc 
leu 


tta 
leu 


gcg 
ala 


ggc 
gly 


cat 
his 


gga 
gly 


ctg 
leu 


gtc 
val 


ttg tta 
leu leu 
721/241 


eaa 
gin 


ccg 
pro 


cga 
arg 


egg 
arg 


gtg 
val 


ate 
ile 


get 
ala 


gac 
asp 


gga aac 
gly asn 
781/261 


ctg 
leu 


etc 
leu 


ate 
ile 


cat 
his 


cgt 
arg 


gcc 
ala 


gcg 
ala 


cgt 
arg 


cgc agg 
arg arg 
841/281 


cat 
his 


cgt 
arg 


gaa 
glu 


cgc 
arg 


ttg 
leu 


aca 
thr 


gcc 
ala 


gtc 
val 


teg tga 
ser OPA 



















: 537-544) et contenant Rv2622 



31/11 


















aac aaa 
asn lys 
91/31 


cgt 
arg 


ggc 
gly 


aat 
asn 


gcc 
ala 


ggg 

gly 


cag 
gin 


cct 
pro 


ctg 
leu 


cag ggg 
gin gly 
151/51 


cac 
his 


tgg 
trp 


ctg 
leu 


ctg 
leu 


gcc 
ala 


egg 
arg 


ctg 
leu 


ggc 

gly 


etc acc 
leu thr 
211/71 


egg 
arg 


aca 
thr 


ctg 
leu 


ctg 
leu 


gcc 
ala 


cgc 
arg 


gcc 
ala 


gag 
glu 


ccg ggc 
pro gly 
271/91 


ctg 
leu 


ggc 
gly 


cgc 
arg 


acc 
thr 


gca 
ala 


gcc 
ala 


gaa 
glu 


ate 
ile 


gcg gag 
ala glu 
331/111 


age 
ser 


gat 
asp 


ccc 
pro 


aac 
asn 


gcg 
ala 


gcc 
ala 


aac 
asn 


ctg 
leu 


gtc egg 
val arg 
391/131 


gtc 
val 


acc 
thr 


gac 
asp 


gcg 
ala 


gcc 
ala 


gat 
asp 


acc 
thr 


gga 

gly 


ggc gag 
gly glu 
451/151 


gcg 
ala 


atg 
met 


ctg 
leu 


acc 
thr 


atg 
met 


eaa 
gin 


ggc 

giy 


aac 
asn 


gcg egg 
ala arg 
511/171 


gtg 
val 


ctg 
leu 


agg 
arg 


ccg 
pro 


ggt 
gly 


ggc 
gly 


cgc 
arg 


tac 
tyr 


gac gtc 
asp val 
571/191 


gca 
ala 


gag 
glu 


cag 
gin 


gtc 
val 


cgc 
arg 


acc 
thr 


gac 
asp 


ctg 
leu 


aat gcg 
asn ala 
631/211 


cgt 
arg 


ccg 
pro 


ctg 
leu 


acc 
thr 


gtt 
val 


gcg 
ala 


gaa 
glu 


tgg 
trp 


gtc gaa 
val glu 
691/231 


cac 
his 


gtt 
val 


gtc 
val 


acc 
thr 


get 
ala 


tec 
ser 


atg 
met 


gcg 
ala 


gaa ggc 
glu gly 
751/251 


etc 
leu 


ctg 
leu 


ggt 
gly 


gcg 
ala 


ctg 
leu 


egg 
arg 


ttc 
phe 


gcc 
ala 


egg cga 
arg arg 
811/271 


gtc 
val 


ctg 
leu 


ttg 
leu 


atg 
met 


cgc 
arg 


cac 
his 


aca 
thr 


ttc 
phe 


gcc att 
ala ile 


gtc 
val 


gcg 
ala 


cac 
his 


aaa 
lys 


ccg 
pro 


cac 
his 


gtc 
val 


gat 
asp 



SEQ ID N° 42F 
FIGURE 42F 



FEU1LLE DE REM PLACEMENT (REGLE 26) 



WO 99/09186 



VFR98/01813 



140/X85 



1/1 








ate gcg 


cgt 


gac 


ate 


lie ala 


arg 


asp 


ile 


61/21 








gtt gtt 


tea 


gcg 


ggc 


val val 


ser 


ala 


gly 


121/41 






aag att 


aag 


gtc 


gcg 


lys ile 


lys 


val 


ala 


181/61 








gtt ctg 


cac 


cgc 


cat 


val leu 


his 


arg 


his 


241/81 








ctg acc 


ggg 


ttg 


gcg 


leu thr 


gly 


leu 


ala 



gat gac cag ggt egg 
asp asp gin gly arg 

gac gtg gtg cat ttg 
asp val val his leu 

ggc atg age tat ccg 
gly met ser tyr pro 

ccg cac tgg aat cgc 
pro his trp asn arg 

gcg ttc ggg tec gga 
ala phe gly ser gly 



31/11 

ctg tgt ctg gac gtc 
leu cys leu asp val 
91/31 

cgt taa etc gcg egg 
arg OCH leu ala arg 
151/51 

gag aat gtc ctg gec 
glu asn val leu ala 
211/71 

tta ate tgg ccc gtc 
leu ile trp pro val 
271/91 

ttc gtc aac teg aca 
phe val asn ser thr 



ggc 
gly 


ggt 
gly 


cga 
arg 


acg 
thr 


gta 
val 


age 
ser 


tgg 
trp 


cgt 
arg 


ccc 
pro 


caa 
gin 


get 
ala 


ggc 
gly 


gag 
glu 


cag 
gin 


gtc 
val 


gtg 
val 


gtg 
val 


ctg 
leu 


gtc 
val 


ttg 
leu 


cct 
pro 


tgg 
trp 


cag 
gin 


cag 
gin 


ate 
ile 



SEQ ID N° 43A 



FIGURE 43A 



1/1 

teg cgc gtg aca 
ser arg val thr 
61/21 

ttg ttt cag .egg 
leu phe gin arg 
121/41 

aga tta agg teg 
arg leu arg ser 
181/61 

ttc tgc acc gec 
phe cys thr ala 
241/81 

tga ccg ggt tgg 
OPA pro gly trp 



teg atg acc agg 
ser met thr arg 

gcg acg tgg tgc 
ala thr trp cys 

egg gca tga get 
arg ala OPA ala 

ate cgc act gga 
ile arg thr gly 

egg cgt teg ggt 
arg arg ser gly 



31/11 
gtc ggc tgt gtc 
val gly cys val 

91/31 
att tgc gtt aac 
ile cys val asn 

151/51 
ate egg aga atg 
ile arg arg met 

. 211/71 
ate get taa tct 
ile ala OCH ser 

271/91 
ccg gat teg tea 
pro asp ser ser 



tgg acg teg gcg 
trp thr ser ala 

teg cgc gga get 
ser arg gly ala 

tec tgg ccg ctg 
ser trp pro leu 

ggc ccg teg tgg 
gly pro ser trp 

act cga cac ctt 
thr arg his leu 



gtc gaa egg tag 
val glu arg AMB 

ggc gtc ccc aaa 
gly val pro lys 

gcg age agg teg 
ala ser arg ser 

tgc tgg tct tgc 
cys trp ser cys 

ggc age aga tc 
gly ser arg 



SEQ ID N° 43B 



FIGURE 43B 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 




PCT/FR98/01813 



141/185 



1/1 31/U 

gtg tct c 
val ser c 
91/31 
tta act < 
leu thr £ 
151/51 
gaa tgt c 
glu cys % 
211/71 
aat ctg c 
asn leu e 
271/91 
cgt caa c 
arg gin 1 

SEQ ID N° 43C 
FIGURE 43C 



cgc gcg tga cat 


cga 


tga 


cca 


ggg teg get 


arg ala CPA his 


arg 


OPA 


pro 


gly 


ser 


ala 


61/21 












tgt ttc age ggg 


cga 


cgt 


ggt 


gca 


ttt 


gcg 


cys phe ser gly 


arg 


arg gly 


ala 


phe 


ala 


121/41 












gat taa ggt cgc 


ggg 


cat 


gag 


eta 


tec 


gga 


asp OCH gly arg 


gly 


his 


glu 


leu 


ser 


gly 


181/61 










tct gca ccg cca 


tec 


gca 


ctg 


gaa 


teg 


ctt 


ser ala pro pro 


ser 


ala 


leu 


glu 


ser 


leu 


241/81 












gac egg gtt ggc 


ggc 


gtt egg 


gtc egg att 


asp arg val gly 


gly 


val 


arg 


val 


arg 


ile 



Sequence codante Rv3278c predite par O 
contenant seq43A: 

1/1 

atg age tat ccg gag aat gtc ctg gec get 
Met ser tyr pro glu asn val leu ala ala 
61/21 

cac tgg aat cgc tta ate tgg ccc gtc gtg 
his trp asn arg leu ile trp pro val val 
121/41 

ttc ggg tec gga ttc gtc aac teg aca cct 
phe gly ser gly phe val asn ser thr pro 
181/61 

gcg gtc ate tgg ggg ate tgg ttg gtg ate 
ala val ile trp gly ile trp leu val ile 
241/81 

age tgg ctg acc aca cat ttc gtg gtg ace 
ser trp leu thr thr his phe val val thr 
301/101 

ctg acc cgc age ggg ate gac ata ccg eta 
leu thr arg ser gly ile asp ile pro leu 
361/121 

egg ate ttc gag egg att ttt cgc acc ggg 
arg ile phe glu arg ile phe arg thr gly 
421/141 

ccg etc gag ttc tac aac att ccg cgc ctg 
pro leu glu phe tyr asn ile pro arg leu 
481/161 

gtt ttc gac acc ctg ggc tec gac gag teg 
val phe asp thr leu gly ser asp glu ser 



e et al., 1998 (Nature 393:537-544) et 



31/11 


















ggc gag 
gly glu 
91/31 


cag 
gin 


gtc 
val 


gtt 

val 


ctg 
leu 


cac 
his 


cgc 
arg 


cat 
his 


ccg 
pro 


gtg ctg 
val leu 
151/51 


gtc 
val 


ttg 
leu 


ctg 
leu 


acc 
thr 


ggg 

gly 


ttg 
leu 


gcg 
ala 


gcg 
ala 


tgg cag 
trp gin 
211/71 


cag ate 
gin ile 


get 
ala 


aag 
lys 


aac 
asn 


gtg 
val 


att 
ile 


cac 
his 


gtc ggc 
val gly 
271/91 


tgg 
trp 


etc 
leu 


acg 
thr 


ctg 
leu 


tgg 
trp 


cca 
pro 


ttc 
phe 


ctg 
leu 


aac egg 
asn arg 
331/111 


egg 
arg 


gtg 
val 


atg 
met 


ttc 
phe 


egg 
arg 


cat 
his 


ggt gtg 
gly val 


gca egg 
ala arg 
391/131 


ate 
ile 


aac 
asn 


age 
ser 


gtg 
val 


gag 
glu 


ttc 
phe 


egg 
arg 


gac 
asp 


acg ttg 
thr leu 
451/151 


att 
ile 


ate 
ile 


gag 
glu 


tec 
ser 


gcg 
ala 


tea 
ser 


caa 
gin 


gat 
asp 


egg gag 
arg glu 
511/171 


gtg cat 
val his 


gcg 
ala 


ttg 
leu 


ctg 
leu 


tat 
tyr 


cac 
his 


gag 
glu 


ccc age 
pro ser 


tga 
OPA 

















SEQ ID N° 4 3D 



FIGURE 43D 
FEUILLE DE REM PLACEMENT (REGLE 26) 



WO 99/09186 



TCT/FR98/01813 



142/185 



ORF d'apres Cole et al., 1998 (Nature 393:537-544) et contenant Rv3278c 
1/1 31/11 

taa etc gcg egg age tgg cgt ccc caa aag att aag gtc gcg ggc atg age tat ccg gag 
OCH leu ala arg ser trp arg pro gin lys ile lys val ala gly met ser tyr pro glu 
61/21 91/ 31 

aat gtc ctg gec get ggc gag cag gtc gtt ctg cac cgc cat ccg cac tgg aat cgc tta 
asn val leu ala ala gly glu gin val val leu his arg his pro his trp asn arg leu 
121/41 151/51 

ate tgg ccc gtc gtg gtg ctg gtc ttg ctg acc ggg ttg gcg gcg ttc ggg tec gga ttc 
ile trp pro val val val leu val leu leu thr gly leu ala aia phe gly ser gly phe 
181/61 211/71 

gtc aac teg aca cct tgg cag cag ate get aag aac gtg att cac gcg gtc ate tgg ggg 
val asn ser thr pro trp gin gin ile ala lys asn val ile his ala val ile trp gly 
241/81 271/91 

ate tgg ttg gtg ate gtc ggc tgg etc acg ctg tgg cca ttc ctg age tgg ctg acc aca 
ile trp leu val ile val gly trp leu thr leu trp pro phe leu ser trp leu thr thr 
301/101 331/111 

cat ttc gtg gtg acc aac egg egg gtg atg ttc egg cat ggt gtg ctg acc cgc age ggg 
his phe val val thr asn arg arg val met phe arg his gly val leu thr arg ser gly 
361/121 391/131 

ate gac ata ccg eta gca egg ate aac age gtg gag ttc egg gac egg ate ttc gag egg 
ile asp ile pro leu ala arg ile asn ser val glu phe arg asp arg ile phe glu arg 
421/141 451/151 

att ttt cgc acc ggg acg ttg att ate gag tec gcg tea caa gat ccg etc gag ttc tac 
ile phe arg thr gly thr leu ile ile glu ser ala ser gin asp pro leu glu phe tyr 
481/161 511/171 

aac att ccg cgc ctg egg gag gtg cat gcg ttg ctg tat cac gag gtt ttc gac acc ctg 
asn He pro arg leu arg glu val his ala leu leu tyr his glu val phe asp thr leu 
541/181 

ggc tec gac gag teg ccc age tga 
gly ser asp glu ser pro ser OPA 



SEQ ID N° 43F 
FIGURE 43F 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 




PCT/FR98/01813 



143/185 



1/1 

gcc aag atg gat gtc tac caa cgc acc gcc 
ala lys met asp val tyr gin arg thr ala 
61/21 

acc acc cat ate ggt teg gcg ggc atg gcg 
thr thr his ile gly ser ala gly met ala 
121/41 

ccg atg ggg gtt tac age ctg gac tec get 
pro met gly val tyr ser leu asp ser ala 
181/61 

ttg ccg tat acc caa gtc gga ccc aat cac 
leu pro tyr thr gin val gly pro asn his 
241/81 

ttt aac tec atg cag gtc tgt cag aag tec 
phe asn ser met gin val cys gin lys ser 
301/101 

aac ctg caa ate ccg cag tac aag cat teg 
asn leu gin ile pro gin tyr lys his ser 
361/121 

cca ggc aaa ggc tec gcg ttc ttc ttt cac 
pro gly lys gly ser ala phe phe phe his 
421/141 
gtg gcg ate 
val ala ile 



31/11 

gcc ggc tgg cag ccg etc aag acc ggt ate 

ala gly trp gin pro leu lys thr gly ile 
91/31 

ccg gaa gcc aag age gga tat ccg gcc act 

pro glu ala lys ser gly tyr pro ala thr 
151/51 

ttt ggc acc gcg ccg aat ccc ggt ggc ggg 

phe gly thr ala pro asn pro gly gly gly 
211/71 

tgg tgg agt ggc gac gac aat age ccc acc 

trp trp ser gly asp asp asn ser pro thr 
271/91 

cag tgc ccg ttc age acg gcc gac age gag 

gin cys pro phe ser thr ala asp ser glu 
331/111 

gtc gtg atg ggc gtc aac aag gcc aag gtc 

val val met gly val asn lys ala lys val 
391/131 

acc acc gac ggc ggg ccc acc gcg ggt tgt 

thr thr asp gly gly pro thr ala gly cys 



SEQ ID N° 44A 
FIGURE 44A 



1/1 

cca aga tgg atg tct acc aac 
pro arg trp met ser thr asn 
61/21 

cca ccc ata teg gtt egg egg 
pro pro ile ser val arg arg 
121/41 

cga tgg ggg ttt aca gcc tgg 
arg trp gly phe thr ala trp 
181/61 

tgc cgt ata ccc aag teg gac 
cys arg ile pro lys ser asp 
241/81 

tta act cca tgc agg tct gtc 
leu thr pro cys arg ser val 
301/101 

acc tgc aaa tec cgc agt aca 
thr cys lys ser arg ser thr 
361/121 

cag gca aag get ccg cgt tct 
gin ala lys ala pro arg ser 
421/141 
tgg cga tc 
trp arg 









31/11 




gca 


ccg 


ccg 


ccg get 


ggc 


ala 


pro 


pro 


pro ala 


gly 








91/31 




gca tgg 


cgc 


egg aag 


cca 


ala 


trp 


arg 


arg lys 


pro 








151/51 




act 


ccg 


ctt 


ttg gca 


ccg 


thr 


pro 


leu 


leu ala 


pro 








211/71 




cca 


ate 


act 


ggt gga 


gtg 


pro 


ile 


thr 


gly gly 


val 








271/91 




aga 


agt 


ccc 


agt gcc 


cgt 


arg 


ser 


pro 


ser ala 


arg 








331/111 


age 


att 


egg 


teg tga 


tgg 


ser 


ile 


arg 


ser OPA 


trp 








391/131 


tct 


ttc 


aca 


cca ccg 


acg 


ser phe 


thr 


pro pro 


thr 



age cgc tea aga ccg gta tea 

ser arg ser arg pro val ser 

aga gcg gat ate egg cca etc 

arg ala asp ile arg pro leu 

cgc cga ate ccg gtg gcg ggt 

arg arg ile pro val ala gly 

gcg acg aca ata gcc cca cct 

ala thr thr ile ala pro pro 

tea gca egg ccg aca gcg aga 

ser ala arg pro thr ala arg 

gcg tea aca agg cca agg tec 

ala ser thr arg pro arg ser 

gcg ggc cca ccg egg gtt gtg 

ala gly pro pro arg val val 



SEQ ID N° 44B 
FEU1LLE DE REMP^^gEyj^REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



144/185 



1/1 

caa gat gga tgt eta cca acg cac cgc cgc 
gin asp gly cys leu pro thr his arg arg 
61/21 

cac cca tat egg ttc ggc ggg cat ggc gec 
his pro tyr arg phe gly gly his gly ala 
121/41 

gat ggg ggt tta cag cct gga etc cgc ttt 
asp gly gly leu gin pro gly leu arg phe 
181/61 

gec gta tac cca agt egg ace caa tea ctg 
ala val tyr pro ser arg thr gin ser leu 
241/81 

taa etc cat gca ggt ctg tea gaa gtc cca 
OCH leu his ala gly leu ser glu val pro 
301/101 

cct gca aat ccc gca gta caa gca ttc ggt 
pro ala asn pro ala val gin ala phe gly 
361/121 

agg caa agg etc cgc gtt ctt ctt tea cac 
arg gin arg leu arg val leu leu ser his 
421/141 
ggc gat c 
gly asp 



31/11 
















cqo eta aca 
arg leu ala 
91/31 


gec 
ala 


get 
ala 


caa 
gin 


gac 
asp 


egg 
arg 


tyr 


cac 
his 


gga age caa 
gly ser gin 
151/51 


gag 
glu 


egg 
arg 


ata 
ile 


tec 
ser 


ggc 
gly 


cac 
his 


ccc 
ser 


tgg cac cgc 
trp his arg 
211/71 


gee 
ala 


gaa 
glu 


tec 
ser 


egg 
arg 


tgg 
trp 


egg 
arg 


gtt 
val 


gtg gag tgg 
val glu trp 
271/91 


cga cga caa 
arg arg gin 


tag 
AMB 


ccc 
pro 


cac 
his 


ctt 
leu 


gtg ccc gtt 
val pro val 
331/111 


cag 
gin 


cac 
his 


ggc 
gly 


cga 
arg 


cag 
gin 


cga 
arg 


gaa 
glu 


cgt gat ggg 
arg asp gly 
391/131 


cgt caa caa 
arg gin gin 


ggc 
gly 


caa 
gin 


ggt 
gly 


ccc 
pro 


cac cga egg 
his arg arg 


egg 
arg 


gec 
ala 


cac 
his 


cgc 
arg 


ggg 

gly 


ttg 
leu 


tgt 
cys 



SEQ ID N° 44C 
FIGURE 44C 



FEUILLE DE REMPLACEMENT (REGLE 26) 




WO 99/09186 ^^PCT/FR98/01813 

145/185 

Sequence codante Rv0309 predite par Cole et al., 1998 (Nature 393:537-544) et 
contenant Seq44A: ' 

1/1 31/11 

gcg gta 
ala val 
91/31 
ccg tgg 
pro trp 
151/51 
ggt teg 
gly ser 
211/71 
acc ggt 
thr gly 
271/91 
ccg gec 
pro ala 
331/111 
ggt ggc 
gly gly 
391/131 
age ccc 
ser pro 
451/151 
gac age 
asp ser 
511/171 
gec aag 
ala lys 
571/191 
gcg ggt 
ala gly 
631/211 



atg age 
Met ser 
61/21 


cga 
arg 


etc 
leu 


eta 
leu 


get 
ala 


ttg 
leu 


ctq 
leu 


tqc 
cys 


act 
ala 


etc gcg 
leu ala 
121/41 


cca 
pro 


gtg 

val 


age 
ser 


ctg 
leu 


gee 
ala 


gtc 
val 


gtc 
val 


aac 
asn 


act cag 
thr gin 
181/61 


gtg 

val 


gtt 

val 


teg 
ser 


gtg 
val 


gtg 

val 


gga 
gly 


acc 
thr 


gly 


cgc acc 
arg thr 
241/81 


gec 
ala 


gec 
ala 


ggc 
gly 


tgg 

trp 


cag 
gin 


ccg 
pro 


etc 
leu 


aaq 
lys 


ggc atg 
gly met 
301/101 


gcg 
ala 


ccg 
pro 


gaa 
glu 


gec 
ala 


aag 
lys 


age 
ser 


gga 
gly 


tat 
tyr 


gac tec 
asp ser 
361/121 


get 
ala 


ttt 
phe 


ggc 

gly 


acc 
thr 


gcg 
ala 


ccg 
pro 


aat 
asn 


ccc 
pro 


ccc aat 
pro asn 
421/141 


cac 
his 


tgg 
trp 


tgg 
trp 


agt 
ser 


ggc 
gly 


gac 
asp 


gac 
asp 


aat 
asn 


cag aag 
gin lys 
481/161 


tec 
ser 


cag 
gin 


tgc 
cys 


ccg 
pro 


ttc 
phe 


age 
ser 


acg 
thr 


gee 
ala 


aag cat 
lys his 
541/181 


teg 
ser 


gtc 
val 


gtg 
val 


atg 
met 


ggc 
gly 


gtc 
val 


aac 
asn 


aag 
lys 


ttc ttt 
phe phe 
601/201 


cac 
his 


acc 
•thr 


acc 
thr 


gac 
asp 


ggc 
gly 


ggg 

gly 


ccc 
pro 


acc 
thr 


ctg gtg 
leu val 


cag 
gin 


ate 
ile 


ate 
ile 


cgt 
arg 


tgg 
trp 


ctg 
leu 


egg 
arg 


cct 
pro 



tgc 
cys 


acg 
thr 


ggc 
gly 


tgc 
cys 


gtt 

val 


get 
ala 


gtg 
val 


gtt 

val 


ttc 
phe 


gcg 
ala 


aac 
asn 


teg 
ser 


gtc 
val 


ggc 
gly 


aat 
asn 


gec 
ala 


acg 
thr 


gee aag 
ala lys 


atg 
met 


gat 
asp 


gtc 

val 


tac 
tyr 


caa 
gin 


ate 
ile 


acc 
thr 


acc 
thr 


cat 
his 


ate 
ile 


ggt 
gly 


teg 
ser 


gcg 
ala 


act 
thr 


ccg 
pro 


atg 
met 


ggg 

gly 


gtt 
val 


tac 
tyr 


age 
ser 


ctg 
leu 


ggg 

gly 


ttg 
leu 


ccg: 
pro 


tat 
tyr 


acc 
thr 


caa 
gin 


gtc 
val 


gga 
gly 


acc 
thr 


ttt 
phe 


aac 
asn 


tec 
ser 


atg 
met 


cag 
gin 


gtc 
val 


tgt 

cys 


gag 
glu 


aac 
asn 


ctg 
leu 


caa 
gin 


ate 
ile 


ccg 
pro 


cag 
gin 


tac 
tyr 


gtc 
val 


cca 
pro 


ggc 
gly 


aaa 
lys 


ggc 
gly 


tec 
ser 


gcg 
ala 


ttc 
phe 


tgt 
cys 


gtg 
val 


gcg 
ala 


ate 
ile 


gac 
asp 


gat 
asp 


gec 
ala 


acg 
thr 


gtg 
val 


ate 
ile 


gcg 
ala 


ate 
ile 


gec 
ala 


aag 
lys 


taa 
OCH 





SEQ ID N° 44D 
FIGURE 44D 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 




PCT/FR98/01813 



146/185 



ORF d'apres Cole et al., 1998 (Nature 393:537-544) et contenant Rv0309 



1/1 



tga gcg atg age 
OPA ala met ser 
61/21 


cqa 
arg 


etc 
leu 


eta 
leu 


act 
ala 


tta 
**y 

leu 


ctg 
leu 


gtg gtt etc gcg 
val val leu ala 
121/41 


cca 
pro 


ata 
val 


aac 
ser 


ctg 
leu 


acc 
ala 


gtc 
val 


aat gee act cag 
asn ala thr gin 
181/61 


qtq 
val 


qtt 
val 


tea 
ser 


ata 
y w yj 

val 


ata 
y ^*y 

val 


aaa. 
gly 


tac caa cgc acc 
tyr gin arg thr 
241/81 


acc 
ala 


gcc 
ala 


aac 
gly 


too 
*-yy 

trp 


cag 
gin 


ccg 
pro 


teg gcg ggc atg 
ser ala gly met 
301/101 


gcg 
ala 


ccg 
pro 


gaa 
glu 


gcc 
ala 


aaa 
lys 


aac 
"y w 

ser 


age ctg gac tec 
ser leu asp ser 
361/121 


act 
ala 


ttt 
phe 


cac 
gly 


acc 
thr 


y *-y 
ala 


ccg 
pro 


gtc gga ccc aat 
val gly pro asn 
421/141 


cac 
his 


tgg 
trp 


tgg 
trp 


agt 
ser 


ggc 
gly 


gac 
asp 


gtc tgt cag aag 
val cys gin lys 
481/161 


tec 
ser 


cag 
gin 


tgc 
cys 


ccg 
pro 


ttc 
phe 


age 
ser 


cag tac aag cat 
gin tyr lys his 
541/181 


teg 
ser 


gtc 
val 


gtg 
val 


atg 
met 


ggc 
gly 


gtc 
val 


gcg ttc ttc ttt 
ala phe phe phe 
601/201 


cac 
his 


acc 
thr 


acc 
thr 


gac 
asp 


ggc 
gly 


ggg 

gly 


gcc acg ctg gtg 
ala thr leu val 
661/221 


cag 
gin 


ate 
ile 


ate 
ile 


cgt 
arg 


tgg 
trp 


ctg 
leu 



taa 
OCH 



31/11 


















tgc get 
cys ala 
91/31 


gcg 
ala 


gta 
val 


tgc 
cvs 


acg 
thr 


ggc 

al v 
y^y 


tgc 
cys 


gtt 

val 


get 

al a 
ala 


gtc aac 
val asn 
151/51 


ccg 
pro 


tgg 
trp 


ttc 
phe 


gcg 
ala 


aac 
asn 


teg 
ser 


gtc 

val 


ggc 

gly 


acc ggc 
thr qlv 
211/71 


ggt 

alv 
y * j 


teg 
ser 


acg 
thr 


gcc 
ala 


aag 

lvs 
xys 


atg 

IMC U 


gat 

asp 


gtc 
val 


etc aag 
leu lys 
271/91 


acc 
thr 


ggt 
alv 


ate 
ile 


acc 
thr 


acc 
thr 


cat 

hi <; 


ate 

1 1 e> 


ggt 
gly 


gga tat 
gly tyr 
331/111 


ccg 
pro 


gcc 
ala 


act 
thr 


ccg 
pro 


atg 
met 


ggg 
gly 


gtt 

Vol 


tac 
tyr 


aat ccc 
asn pro 
391/131 


ggt 
gly 


ggc 
gly 


ggg 

gly 


ttg 
leu 


ccg 
pro 


tat 
tyr 


acc 
thr 


caa 
gin 


gac aat 
asp asn 
451/151 


age 
ser 


ccc 
pro 


acc 
thr 


ttt 
phe 


aac 
asn 


tec 
ser 


atg 
met 


cag 
gin 


acg gcc 
thr ala 
511/171 


gac 
asp 


age 
ser 


gag 
glu 


aac 
asn 


ctg 
leu 


caa 
gin 


ate 
ile 


ccg 
pro 


aac aag 
asn lys 
571/191 


gcc 
ala 


aag 
lys 


gtc 
val 


cca 
pro 


ggc 
gly 


aaa 
lys 


ggc 
gly 


tec 
ser 


ccc acc 
pro thr 
631/211 


gcg 
ala 


ggt 
gly 


tgt 
cys 


gtg 
val 


gcg 
ala 


ate 
ile 


gac 
asp 


gat 
asp 


egg cct 
arg pro 


ggt 
gly 


gcg 
ala 


gtg 
val 


ate 
ile 


gcg 
ala 


ate 
ile 


gcc 
ala 


aag 
lys 



SEQ ID N° 44F 
FIGURE 44F 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 




PCT/FR98/01813 



147/185 



Fragment clone en 



1/1 



gat etc 


ccc 


gga 


cac 


asp leu 


pro 


gly 


his 


61/21 








tec ggt 


age 


cag 


agg 


ser gly 


ser 


gin 


arg 


121/41 








ggt cct 


tgc 


cac 


teg 


gly pro 


cys 


his 


ser 


181/61 








ate gtg 


cca 


gac 


egg 


ile val 


pro 


asp 


arg 


241/81 








gtg cga 


ccc 


agg 


atg 


val arg 


pro 


arg 


met 


301/101 








teg gtg 


aag 


ccc 


aac 


ser val 


lys 


pro 


asn 


361/121 








ggt gtg 


gag 


age 


agg 


gly val 


glu 


ser 


arg 


421/141 








tec ccg 


agg 


cca 


egg 


ser pro 


arg 


pro 


arg 


481/161 






ctg gtc 


ate 


agt 


egg 


leu val 


ile 


ser 


arg 


541/181 






acc tgc 


tgt 


tgc 


cac 


thr cys 


cys 


cys 


his 


601/201 








ggc gcg 


ttg 


etc 


agt 


gly ala 


leu 


leu 


ser 


661/221 








teg get 


gcc 


gtt 


acc 


ser ala 


ala 


val 


thr 


721/241 








age cac 


att 


ggg 


gcg 


ser his 


ile 


gly 


ala 


781/261 






acc gtc 


agg 


gca 


tea 


thr val 


arg 


ala 


ser 


841/281 








ate gcc 


aac 


gcg 


egg 


ile ala 


asn 


ala 


arg 


901/301 






egg aca 


age 


cga 


tga 


arg thr 


ser 


arg 


OPA 



avec phoA 



cag 
gin 


gtc 
val 


ate 
ile 


egg 
arg 


cga 
arg 


cac 
his 


cag 
gin 


cat 
his 


cag 
gin 


caa 
gin 


cga 
arg 


tec 
ser 


ttg gga 
leu gly 


tga 
OPA 


gca 
ala 


tgc 
cys 


cgc 
arg 


gtc 
val 


ggc 
gly 


gcg 
ala 


a at 
asn 


get 
ala 


egg 
arg 


ggg 

gly 


egg 
arg 


egg 
arg 


tac 
tyr 


aac 
asn 


cgc 
arg 


a eg 
thr 


ttg 
leu 


tec 
ser 


teg 
ser 


teg 
ser 


cct 
pro 


tga 
OPA 


gcg 
ala 


egg 
arg 


gga 
gly 


gcg 
ala 


ate 
ile 


get agg 
ala arg 


cgc 
arg 


cac 
his 


tgg 
trp 


ccg 
pro 


ggc 
gly 


gcc 
ala 


teg 
ser 


gcg 
ala 


gcc 
ala 


gac 
asp 


ggc 
gly 


teg 
ser 


acg 
thr 


gcc 
ala 


gcg 
ala 


acc 
thr 


cgc 
arg 


aaa 
lys 


gtc 
val 


teg 
ser 


gtg 
val 


ccg 
pro 


agg 
arg 


egg 
arg 


cgc 
arg 


tec 
ser 


tgt 
cys 


cct 
pro 


cct 
pro 


cat 

his 


gtg 
val 


ggc 
gly 


cgc 
arg 


ccg 
pro 


cgc 
arg 


tgg 
trp 



31/11 

gat ggt gat cga ggc 
asp gly asp arg gly 
91/31 

cat cgc gat ggc cag 
his arg asp gly gin 
151/51 

egg tgg ggc ata get 
arg trp gly ile ala 
211/71 

aag ctg teg ggc gcg 
lys leu ser gly ala 
271/91 

tea ccg gcg aag tgg 
ser pro ala lys trp 
331/111 

cac gcc cga ttg tec 
his ala arg leu ser 
391/131 

cga ccg get age agt 
arg pro ala ser ser 
451/151 

agg atg tgc aat tea 
arg met cys asn ser 
511/171 

gga aag ccg ctg cgt 
gly lys pro leu arg 
571/191 

ccg gga tag ccg tac 
pro gly AMB pro tyr 
631/211 

age gcc gtg gtg teg 
ser ala val val ser 
691/231 

gcc tgc cag ccg cgc 
ala cys gin pro arg 
751/251 

ccc ctg ggg tag cgc 
pro leu gly AMB arg 
811/271- 

ata teg ctg ggc ggc 
ile ser leu gly gly 
871/291 

atg aac cga tgc gtg 
met asn arg cys val 
931/311 

acg ggg ctt gta gcg 
thr gly leu val ala 



teg 
ser 


gac ccg 
asp pro 


cag 
gin 


gca 
ala 


cat 
his 


gcc gcg 
ala ala 


ccg 
pro 


teg 
ser 


age 
ser 


gcg cac 
ala his 


cag 
gin 


gtc 
val 


ggt 
gly 


tag age 
AMB ser 


ggt 

gly 


age 
ser 


tag 
AMB 


ccg egg 
pro arg 


atg 
met 


atg 
met 


tea 
ser 


ccg ttg 
pro leu 


gtc 
val 


tec 
ser 


egg 
arg 


egg gcc 
arg ala 


aac 
asn 


gcc 
ala 


gtc 
val 


aac teg 
asn ser 


aag 
lys 


tag 
AMB 


tgc 
cys 


aag ccc 
lys pro 


agt 
ser 


acc 
thr 


gcc 
ala 


act ccg 
thr pro 


age 
ser 


att 
ile 


gcg 
ala 


gcc teg 
ala ser 


gcc 
ala 


tgt 
cys 


cgc 
arg 


egg atg 
arg met 


tgc 
cys 


tec 
ser 


ate 
ile 


gcg teg 
ala ser 


aca 
thr 


tac 
tyr 


aga 
arg 


teg atg 
ser met 


agg 
arg 


aat 
asn 


ctt 
leu 


gcg cac 
ala his 


cag 
gin 


tat 
tyr 


tat 
tyr 


ggc cgt 
gly arg 


ttc 
phe 


cgc 
arg 



SEQ ID N° 45ZA 
FIGURE 45ZA 

FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCIYFR98/01813 



148/185 



961/321 






tea get cgt 


cqc 


tqc 


ser ala arg 


arg 


CVS 


1021/341 






gat tga cct 


cat 


ate 


asp OPA pro 


arcr 


ile 


1081/361 






att acg tga 


caa 


tct 


ile thr OPA 


gin 


ser 


1141/381 






atg ctt gac 


cag 


ate 


met leu asp 


gin 


ile 


1201/401 






cgt ggc ggg 


ggc 


ttc 


arg gly gly 


gly 


phe 


1261/421 






ate ate ggt 


ctg 


ggg 


ile ile gly 


leu 


gly 


1321/441 






ttc ccg ata 


etc 


age 


phe pro ile 


leu 


ser 


1381/461 






ace ggt cct 


egg 


ttg 


thr gly pro 


arg 


leu 


1441/481 






cag cgt cgt 


acc 


aag 


gin arg arg 


thr 


lys 



ggc gec gee ggg ata 
gly ala ala gly ile 

ate tga gtt agt tgc 
ile OPA val ser cys 

gtc ggc aag gag gga 
val gly lys glu gly 

gag age get etc tac 
glu ser ala leu tyr 

cgc gca ccg acc gcg 
arg ala pro thr ala 

atg ttg gtt tec ggc 
met leu val ser gly 

gtt ttc ggt ttt gtc 
val phe gly phe val 

tec ggc agg atg gat 
ser gly arg met asp 

ggg gec ggg ggc tea 
gly ala gly gly ser 



991/331 

gaa teg ccc gcg aac 
glu ser pro ala asn 
1051/351 

ccg cgc aat ggg cat 
pro arg asn gly his 
1111/371 

cgc atg cca etc tec 
arg met pro leu ser 
1171/391 

gec gaa gat ccc aag 
ala glu asp pro lys 
1231/411 

egg egg cgc ctg cag 
arg arg arg leu gin 
1291/431 

gtg gcg ttc aaa gag 
val ala phe lys glu 
1351/451 

gtg atg ttc ggt ggt 
val met phe gly gly 
1411/471 

cgt ggc gga teg get 
arg gly gly ser ala 
1471/491 

ttc acc age cgt atg 
phe thr ser arg met 



cag 
gin 


tgg 
trp 


tac 
tyr 


ggc 
gly 


gca 
ala 


ccg 
pro 


cgt 
arg 


gtt 
val 


ate 
ile 


ggt 
gly 


gat 
asp 


cat 
his 


gag 
glu 


cag 
gin 


egg 
arg 


ttc 
phe 


gca 
ala 


teg 
ser 


agt 
ser 


gtc 
val 


ggc 

gly 


gcg 
ala 


gcg 
ala 


ttg 
leu 


ttc 
phe 


acc 
thr 


atg 
met 


ate 
ile 


gga 
gly 


agt 
ser 


gtg 
val 


gtg 
val 


tat 
tyr 


gec 
ala 


ate 
ile 


get 
ala 


ggg 
gly 


get 
ala 


teg 
ser 


cgc 
arg 


gaa 
glu 


gat 
asp 


c 







SEQ ID N° 45ZA (suite) 
FIGURE 45ZA (suite) 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 




PCT/FR98/01813 



149/185 



fragment seq45ZA en decalage moins 1 pour la phase de lecture 



1/1 31/11 



ate tec 
ile ser 
61/21 


ccg 
pro 


gac 
asp 


acc 
thr 


agg 
arg 


tea 
ser 


tec 
ser 


ggc gag 
gly glu 


atg gtg 
met val 
91/31 


ate 
ile 


gag 
glu 


get 
ala 


egg 
arg 


acc 
thr 


cgc 
arg 


agg 
arg 


cat 
his 


ccg gta gec 
pro val ala 
121/41 


aga 
arg 


ggc acc 
gly thr 


age 
ser 


ate 
ile 


age 
ser 


aac 
asn 


ate gcg 
ile ala 
151/51 


atg 
met 


gee 
ala 


age 
ser 


atg 
met 


ccg 
pro 


cgc 
arg 


cgt 
arg 


egg 
arg 


gtc ctt 
val leu 
181/61 


gec 
ala 


act 
thr 


cgc 
arg 


gat cct tgg 
asp pro trp 


gat gac 
asp asp 


ggt ggg 
gly gly 
211/71 


gca 
ala 


tag 
AMB 


eta 
leu 


gcg 
ala 


cgc 
arg 


acc 
thr 


agg 
arg 


tea 
ser 


teg tgc cag 
ser cys gin 
241/81 


acc 
thr 


ggg cat 
gly his 


gec 
ala 


gcg 
ala 


teg 
ser 


gca 
ala 


age tgt 
ser cys 
271/91 


egg 
arg 


gcg 
ala 


egg 
arg 


gtt 
val 


aga 
arg 


gcg 

ala 


gta 
val 


gcg 

ala 


tgc gac 
cys asp 
301/101 


cca 
pro 


gga 
gly 


tgg 
trp 


cga atg etc 
arg met leu 


ggg ggt 
gly gly 


cac egg 
his arg 
331/111 


cga 
arg 


agt 
ser 


ggt 
gly 


age 
ser 


cgc 
arg 


gga 
gly 


tga 
OPA 


tgt 
cys 


egg tga age 
arg OPA ser 
361/121 


cca 
pro 


acc 
thr 


ggc ggt aca 
gly gly thr 


acc 
thr 


gec 
ala 


acg ccc 
thr pro 
391/131 


gat 
asp 


tgt 
cys 


cct 
pro 


cac 
his 


cgt 
arg 


tgg 
trp 


tct 
ser 


ccg 
pro 


gtg tgg aga 
val trp arg 
421/141 


gca 
ala 


gga cgt 
gly arg 


tgt 
cys 


cct 
pro 


cgt 
arg 


cgc 
arg 


gac egg 
asp arg 
451/151 


eta 
leu 


gca 
ala 


gtc 
val 


ggc 
gly 


ggg 

gly 


cca 
pro 


acg 
thr 


cct 
pro 


ccc cga ggc 
pro arg gly 
481/161 


cac 
his 


ggc ctt gag cgc 
gly leu glu arg 


ggg gaa 
gly glu 


gga tgt 
gly cys 
511/171 


gca 
ala 


att 
ile 


cag 
gin 


tea 
ser 


act 
thr 


cga 
arg 


agt 
ser 


age 
ser 


tgg tea tea 
trp ser ser 
541/181 


gtc 

val 


ggg cga 
gly arg 


teg 
ser 


eta 
leu 


ggc gcg gaa age 
gly ala glu ser 
. 571/191 


cgc 
arg 


tgc 
cys 


gtt 
val 


gca 
ala 


age 
ser 


cca 
pro 


gta 
val 


cca 
pro 


cct get 
pro ala 
601/201 


gtt 
val 


gec 
ala 


acc 
thr 


act ggc egg 
thr gly arg 


gcg 
ala 


ccc 
pro 


egg gat 
arg asp 
631/211 


age 
ser 


cgt 
arg 


acg 
thr 


cca 
pro 


etc 
leu 


cga 
arg 


gca 
ala 


ttg 
leu 


gcg cgt tgc 
ala arg cys 
661/221 


tea 
ser 


gtt 
val 


egg 
arg 


egg 
arg 


ccg 
pro 


acg 
thr 


gca 
ala 


gcg ccg 
ala pro 
691/231 


tgg 
trp 


tgt 
cys 


egg 
arg 


egg 
arg 


cct 
pro 


egg 
arg 


cct 
pro 


gtt 
val 


egg ctg ccg 
arg leu pro 
721/241 


tta 
leu 


cct 
pro 


cga 
arg 


egg 
arg 


ccg 
pro 


cga 
arg 


ccg 
pro 


cct gec 
pro ala 
751/251 


age 
ser 


cgc 
arg 


gee 
ala 


gec 
ala 


gga 
gly 


tgt 
cys 


get 
ala 


cca 
pro 


gec aca 
ala thr 
781/261 


ttg 
leu 


ggg 

gly 


cgc 
arg 


gca 
ala 


aag 
lys 


tct 
ser 


egg 
arg 


tgc 
cys 


ccc tgg 
pro trp 
811/271 


ggt 
gly 


age 
ser 


gca 
ala 


teg 
ser 


cgt 
arg 


cga 
arg 


cat 
hi/ 


aca 
thr 


ccg tea 
pro ser 
841/281 


ggg 

gly 


cat 
his 


cac 
his 


cga ggc ggc 
arg gly gly 


get 
ala 


cca 
pro 


tat cgc 
tyr arg 
871/291 


tgg 
trp 


gcg 
ala 


gca 
ala 


gat 
asp 


cga 
arg 


tga 
OPA 


gga 
gly 


ata 
ile 


teg cca 
ser pro 
901/301 


acg 
thr 


cgc 
arg 


ggt gtc etc 
gly val leu 


etc 
leu 


atg tga 
met OPA 


tga acc 
OPA thr 
931/311 


gat 
asp 


gcg 
ala 


tgc 
cys 


ttg 
leu 


cgc 
arg 


acc 
thr 


agt 
ser 


ate 
ile 


gga caa 
gly gin 
961/321 


gec 
ala 


gat 
asp 


gag 
glu 


gee 
ala 


gec 
ala 


cgc 
arg 


get 
ala 


gga 
gly 


egg ggc 
arg gly 
991/331 


ttg 
leu 


tag 
AMB 


cgt 
arg 


atg 
met 


gec 
ala 


gtt 
val 


tec 
ser 


get 
ala 


cag etc gtc 
gin leu val 


get 
ala 


gcg 
ala 


gcg 
ala 


ccg 
pro 


ccg 
pro 


gga tag 
gly AMB 


aat cgc 
asn arg 


ccg 
pro 


cga 
arg 


acc 
thr 


agt 
ser 


ggt 
gly 


acg 
thr 


gcg 

ala 


cag 
gin 



SEQ ID N° 45ZB 

FIGURE 45ZB 
FEU1LLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 




PCT/FR98/01813 



150/185 



1021/341 

att gac etc gta tea 
ile asp leu val ser 

1081/361 
tta cgt gac agt ctg 
leu arg asp ser leu 
1141/381 

tgc ttg acc aga teg 
cys leu thr arg ser 
1201/401 

gtg, gcg ggg get tec 
val ala gly ala ser 
1261/421 

tea teg gtc tgg gga 
ser ser val trp gly 
1321/441 

tec cga tac tea gcg 
ser arg tyr ser ala 
1381/461 

ccg gtc etc ggt tgt 
pro val leu gly cys 
1441/481 

age gtc gta cca agg 
ser val val pro arg 



tct gag tta gtt gec 
ser glu leu val ala 

teg gca agg agg gac 
ser ala arg arg asp 

aga gcg etc tct acg 
arg ala leu ser thr 

gcg cac cga ccg cgc 
ala his arg pro arg 

tgt tgg ttt ccg gcg 
cys trp phe pro ala 

ttt teg gtt ttg teg 
phe ser val leu ser 

ccg gca gga tgg ate 
pro ala gly trp ile 

ggg ccg ggg get cat 
gly pro gly ala his 



1051/351 

cgc gca atg ggc ate 
arg ala met gly ile 

1111/371 
gca tgc cac tct ccg 
ala cys his ser pro 
1171/391 

ccg aag ate cca agt 
pro lys ile pro ser 
1231/411 

ggc ggc gec tgc agg 
gly gly ala cys arg 
1291/431 

tgg cgt tea aag aga 
trp arg ser lys arg 
1351/451 

tga tgt teg gtg gtg 
OPA cys ser val val 
1411/471 

gtg gcg gat egg ctg 
val ala asp arg leu 
1471/491 

tea cca gec gta tgg 
ser pro ala val trp 



cgc gtg tta teg gta 
arg val leu ser val 

ate atg age age gga 
ile met ser ser gly 

teg cat cga gtg tec 
ser his arg val ser 

gcg egg cgt tgt tea 
ala arg arg cys ser 

cca tga teg gaa gtt 
pro OPA ser glu val 

tgg tgt atg cca tea 
trp cys met pro ser 

ctg ggg ctt cgc gec 
leu gly leu arg ala 

aag ate 
lys ile 



SEQ ID N° 45ZB (suite) 
FIGURE 452B (suite) 



FEU1LLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 




PCT/FR98/01813 



151/185 



fragment seq45ZA en decalage moins 2 pour la phase de lecture 



1/1 



31/11 



tct ccc egg aca cca ggt cat ccg gcg aga tgg tga teg agg etc gga ccc gca ggc ate 
ser pro arg thr pro gly his pro ala arg trp OPA ser arg leu gly pro ala gly ile 
61/21 91/31 

egg tag cca gag gca cca gca tea gca aca teg cga tgg cca gca tgc cgc gec gtc ggg 
arg AMB pro glu ala pro ala ser ala thr ser arg trp pro ala cys arg ala val gly 
121/41 151/51 

tec ttg cca etc gcg ate ctt ggg atg acg gtg ggg cat age tag cgc gca cca ggt cat 
ser leu pro leu ala ile leu gly met thr val gly his ser AMB arg ala pro gly his 
181/61 211/71 

cgt gee aga ccg ggc atg ccg cgt egg caa get gtc ggg cgc ggg tta gag egg tag cgt 
arg ala arg pro gly met pro arg arg gin ala val gly arg gly leu glu arg AMB arg 
241/81 271/91 

gcg acc cag gat ggc gaa tgc teg ggg gtc ace ggc gaa gtg gta gec gcg gat gat gtc 
ala thr gin asp gly glu cys ser gly val thr gly glu val val ala ala asp asp val 
301/101 331/111 

ggt gaa gee caa ccg gcg gta caa ccg cca cgc ccg att gtc etc acc gtt ggt etc egg 
gly glu ala gin pro ala val gin pro pro arg pro ile val leu thr val gly leu arg 
361/121 391/131 

tgt gga gag cag gac gtt gtc etc gtc gcg acc ggc tag cag teg gcg ggc caa cgc etc 
cys gly glu gin asp val val leu val ala thr gly AMB gin ser ala gly gin arg leu 
421/141 451/151 

ccc gag gee acg gee ttg age gcg ggg aag gat gtg caa ttc agt caa etc gaa gta get 
pro glu ala thr ala leu ser ala gly lys. asp val gin phe ser gin leu glu val ala 
481/161 511/171 

ggt cat cag teg ggc gat cgc tag gcg egg aaa gee get gcg ttg caa gec cag tac cac 
gly his gin ser gly asp arg AMB ala arg lys ala ala ala leu gin ala gin tyr his 
541/181 . 571/191 

ctg ctg ttg cca cca ctg gee ggg cgc ccc ggg ata gec gta cgc cac tec gag cat tgg 
leu leu leu pro pro leu ala gly arg pro gly ile ala val arg his ser glu his tro 
601/201 631/211 

cgc gtt get cag ttc ggc ggc cga egg cag cgc cgt ggt gtc ggc ggc etc ggc ctg ttc 
arg val ala gin phe gly gly arg arg gin arg arg gly val gly gly leu gly leu one 
661/221 691/231 

ggc tgc cgt tac etc gac ggc cgc gac cgc ctg cca gec gcg ccg ccg gat gtg etc cag 
gly cys arg tyr leu asp gly arg asp arg leu pro ala ala pro pro asp val leu gin 
721/241 751/251 

cca cat tgg ggc gcg caa agt etc ggt gee cct ggg gta gcg cat cgc gtc gac ata cac 
pro his trp gly ala gin ser leu gly ala pro gly val ala his arg val asp ile his 
781/261 811/271 

cgt cag ggc ate acc gag gcg gcg etc cat ate get ggg egg cag ate gat gag gaa tat 
arg gin gly ile thr glu ala ala leu his ile ala gly arg gin ile asp glu glu tyr 
841/281 871/291 

cgc caa cgc gcg gtg tec tec tea tgt gat gaa ccg atg cgt get tgc gca cca gta teg 
arg gin arg ala val ser ser ser cys asp glu pro met arg ala cys ala pro val ser 
901/301 931/311 

gac aag ccg atg agg ccg ccc gcg ctg gac ggg get tgt age gta tgg ccg ttt ccg etc 
asp lys pro met arg pro pro ala leu asp gly ala cys ser val trp pro phe pro leu 



SEQ ID N° 45ZC 
FIGURE 45ZC 

FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



152/185 



961/321 
age teg teg 
ser ser ser 
1021/341 
ttg ace teg 
leu thr ser 
1081/361 
tac gtg aca 
tyr val thr 
1141/381 
get tga cca 
ala OPA pro 
1201/401 
tgg egg ggg 
trp arg gly 
1261/421 
cat egg tct 
his arg ser 
1321/441 
ccc gat act 
pro asp thr 
1381/461 
egg tec teg 
arg ser ser 
1441/481 
gcg teg tac 
ala ser tyr 



ctg egg 
leu arg 

tat cat 
tyr his 

gtc tgt 
val cys 

gat cga 
asp arg 

ctt ccg 
leu pro 

ggg gat 
gly asp 

cag cgt 
gin arg 

gtt gtc 
val val 

caa ggg 
gin gly 



cgc cgc egg 
arg arg arg 

ctg agt tag 
leu ser AMB 

egg caa gga 
arg gin gly 

gag cgc tct 
glu arg ser 

cgc acc gac 
arg thr asp 

gtt ggt ttc 
val gly phe 

ttt egg ttt 
phe arg phe 

egg cag gat 
arg gin asp 

ggc egg ggg 
gly arg gly 



gat aga 
asp arg 

ttg ccc 
leu pro 

ggg acg 
gly thr 

eta cgc 
leu arg 

cgc gcg 
arg ala 

egg cgt 
arg arg 

tgt cgt 
cys arg 

gga teg 
gly ser 

etc att 
leu ile 



991/331 
ate gec cgc 
ile ala arg 
1051/351 
gcg caa tgg 
ala gin trp 
1111/371 
cat gee act 
his ala thr 
1171/391 
cga aga tec 
arg arg ser 
1231/411 
gcg gcg cct 
ala ala pro 
1291/431 
ggc gtt caa 
gly val gin 
1351/451 
gat gtt egg 
asp val arg 
1411/471 

tgg egg ate 

trp arg ile 
1471/491 
cac cag ccg 
his gin pro 



gaa cca 
glu pro 

gca tec 
ala ser 

etc cga 
leu arg 

caa gtt 
gin val 

gca ggg 
ala gly 

aga gac 
arg asp 

tgg tgt 
trp cys 

ggc tgc 
gly cys 

tat gga 
tyr gly 



gtg gta egg 
val val arg 

gcg tgt tat 
ala cys tyr 

tea tga gca 
ser OPA ala 

cgc ate gag 
arg ile glu 

cgc ggc gtt 
arg gly val 

cat gat egg 
his asp arg 

ggt gta tgc 
gly val cys 

tgg ggc ttc 
trp gly phe 

aga tc 
arg 



cgc aga 
arg arg 

egg tat 
arg tyr 

gcg gat 
ala asp 

tgt ccg 
cys pro 

gtt cat 
val his 

aag ttt 
lys phe 

cat cac 
his his 

gcg cca 
ala pro 



SEQ ID N° 45ZC (suite 1) 
FIGURE 45ZC {suite 1) 



ORF de seq 45ZA dir€ 
cag tct gtc ggc aag 
gin ser val gly lys 
1141/381 

atg ctt gac cag ate 
met leu asp gin ile 
1201/401 

cgt ggc ggg ggc ttc 
arg gly gly gly phe 
1261/421 

ate ate ggt ctg ggg 
ile ile gly leu gly 
1321/441 

ttc ccg ata etc age 
phe pro ile leu ser 
1381/461 

acc ggt cct egg ttg 
thr gly pro arg leu 
1441/481 

cag cgt cgt acc aag 
gin arg arg thr lys 



tctement en fusion a\ 
gag gga cgc atg cca 
glu gly arg met pro 

gag age get etc tac 
glu ser ala leu tyr 

cgc gca ccg acc gcg 
arg ala pro thr ala 

atg ttg gtt tec ggc 
met leu val ser gly 

gtt ttc ggt ttt gtc 
val phe gly phe val 

tec ggc agg atg gat 
ser gly arg met asp 

ggg gee ggg ggc tea 
gly ala gly gly ser 



ec phoA 

etc tec gat cat gag 
leu ser asp his glu 
1171/391 

gec gaa gat ccc aag 
ala glu asp pro lys 
1231/411 

egg egg cgc ctg cag 
arg arg arg leu gin 
1291/431 

gtg gcg ttc aaa gag 
val ala one lys glu 
1351/451 

gtg atg ttc ggt ggt 
val met phe gly gly 
1411/471 

cgt ggc gga teg get 
arg gly gly ser ala 
1471/491 

ttc acc age cgt atg 
phe thr ser arg met 



cag egg 
gin arg 

ttc gca teg agt gtc 
phe ala ser ser val 

ggc gcg gcg ttg ttc 
gly ala ala leu phe 

acc atg ate gga agt 
thr met ile gly ser 

gtg gtg tat gee ate 
val val tyr ala ile 

get ggg get teg cgc 
ala gly ala ser arg 

gaa gat c 
glu asp 



SEQ ID N° 45A 
FEUILLE DE REMP^g^^REGLE 26) 




WO 99/09186 ^^>CT/FR98/01813 

153/185 

Sequence Rv2169c predite par Cole et al., 1998 (Nature 393:537-544) et contenant 
Seq45A 

I/ 1 31/11 

atg cca etc tec gat cat gag cag egg atg ctt gac cag ate gag age get etc tac gee 

Met pro leu ser asp his glu gin arg met leu asp gin ile glu set ala leu tyr ala 
61/21 91/ 31 

gaa gat ccc aag ttc gca teg agt gtc cgt ggc ggg ggc ttc cgc gca ccg acc gcg egg 

glu asp pro lys phe ala ser ser val arg gly gly giy ph e arg ala pro thr ala arg 
121/41 151/51 

egg cgc ctg cag ggc gcg gcg ttg ttc ate ate ggt ctg ggg atg ttg gtt tec ggc gtg 

arg arg leu gin gly ala ala leu phe ile ile gly leu gly met leu val ser gly val 
181/61 211/71 

gcg ttc aaa gag acc atg ate gga agt ttc ccg ata etc age gtt ttc ggt ttt gtc ata 

yS 9lU thr m6t ile gly Ser Phe pro ile ieu ser val P he Phe val val 
241/81 271/91 

atg ttc ggt ggt gtg gtg tat gee ate acc ggt cct egg ttg tec ggc agg atg gat cgt 

9 7 9 7 V tyr aU U€ thC gly Pr ° arg leu ser arg met asp arg 

301/101 331/111 

ggc gga teg get get ggg get teg cgc cag cgt cgt acc aag ggg gee ggg ggc tea ttc 

/£? 9 y arg gln arg arg thr ^ «ly ala gly gly ser phe 

361/121 391/131 

acc age cgt atg gaa gat egg ttc egg cgc cgc ttc gac gag taa 

thr ser arg met glu asp arg phe arg arg arg phe asp glu OCH 

SEQ ID N° 45D 
FIGURE 45D 

ORFd'apres Cole et al., 1998 (Nature 393:537-544) et contenant Rv2169c 

1/1 31/11 
tga cag tct gtc ggc aag gag gga cgc atg 
OPA gin ser val gly lvs alu alv ara met 
61/21 
gac cag 
asp gin 
121/41 
ggg ggc 
gly gly 
181/61 
ggt ctg 
gly leu 
241/81 
ata etc 
ile leu 
301/101 
cct egg 
pro arg 
361/121 
cgt acc 
arg thr 
421/141 

ttc gac gag taa 
phe asp glu OCH 



tct 


gtc 


ggc 


aag 


gag 


gga 


cgc 


atg 


cca etc 


ser 


val 


gly 


lys 


glu 


gly 


arg 


met 


pro leu 


















91/31 


ate 


gag 


age 


get 


etc 


tac 


gee 


gaa 


gat ccc 


ile 


glu 


ser 


ala 


leu 


tyr 


ala 


glu 


asp pro 


















151/51 


ttc 


cgc 


gca 


ccg 


acc 


gcg 


egg 


egg 


cgc ctg 


phe 


arg 


ala 


pro 


thr 


ala 


arg 


arg 


arg leu 


















211/71 


ggg 


atg 


ttg 


gtt 


tec 


ggc 


gtg 


g<=g 


ttc aaa 


gly 


met 


leu 


val 


ser 


gly 


val 


ala 


phe lys 


















271/91 


age 


gtt 


ttc 


ggt 


ttt 


gtc 


gtg 


atg 


ttc ggt 


ser 


val 


phe 


gly 


phe 


val 


val 


met 


phe gly 


















331/111 


ttg 


tec 


ggc 


agg 


atg 


gat 


cgt 


ggc 


gga teg 


leu 


ser 


gly 


arg 


met 


asp 


arg 


gly 


gly ser 


















391/131 


aag 


ggg 


gee 


ggg 


ggc 


tea 


ttc 


acc 


age cgt 


lys 


gly 


ala 


gly 


giy 


ser 


phe 


thr 


ser arg 



tec 
ser 


gat 
asp 


cat 
his 


gag 
glu 


cag 
gin 


egg atg 
arg met 


ctt 
leu 


aag 

lys 


ttc 
phe 


gca 
ala 


teg agt 
ser ser 


gtc cgt 
val arg 


ggc 
gly 


cag 
gin 


ggc 
gly 


gcg 
ala 


gcg 
ala 


ttg 
leu 


ttc ate 
phe ile 


ate 
ile 


gag 
glu 


acc 
thr 


atg 
met 


ate 
ile 


gga 
gly 


agt ttc 
ser phe 


ccg 
pro 


ggt 
gly 


gtg 
val 


gtg 
val 


tat gec 
tyr ala 


ate acc 
ile thr 


ggt 
gly 


get 
ala 


get 
ala 


ggg 
giy 


get 
ala 


teg 
ser 


cgc cag 
arg gin 


cgt 
arg 


atg 
met 


gaa 
glu 


gat 
asp 


egg ttc 
arg phe 


egg cgc 
arg arg 


cgc 
arg 



SEQ ID N° 45F 
FEUILLE DE REMf^EJE^REGLE 26) 



WO 99/09186 



7FR98/01813 



154/185 



1/1 31/11 

cag ccg cgc cgc ate gac cag ggc etc acg ccc ggt cac ttc tec gcg ttc etc aac aat 

gin pro arg arg ile asp gin gly leu thr pro gly his phe ser ala phe leu asn asn 

61/21 91/31 

tec ggt gaa cat cgc acc agg tta ggc age aat ccc gcg gac ccg cac ccc act cgc cga 

ser gly glu his arg thr arg leu gly ser asn pro ala asp pro his pro thr arc arc 

121/41 151/51 

ccg gee aac tea cag aca ccc tct acg atg cag ggt atg egg acc ccc aga cgc cac tgc 

pro ala asn ser gin thr pro ser thr met gin gly met arg thr pro arg arg his cys 

181/61 211/71 

cgt cgc ate gee gtc etc gee gee gtt age ate gee gee act gtc gtt gee ggc tgc teg 

arg arg ile ala val leu ala ala val ser ile ala ala thr val val ala qlv cvs ser 

241/81 271/91 

teg ggc teg aag cca age ggc gga cca ctt ccg gac gcg aag ccg ctg gtc gag gag gee 

ser gly ser lys pro ser gly gly pro leu pro asp ala lys pro leu val glu glu ala 

301/101 331/111 

.acc gcg cag acc aag get etc aag age gcg cac atg gtg ctg acg gtc aac ggc aag ate 

thr ala gin thr lys ala leu lys ser ala his met val leu thr val asn gly lys ile 



SEQ ID N° 4 6A 
FIGURE 46A 



1/1 

age cgc gee .gca teg acc agg 
ser arg ala ala ser thr arg 
61/21 

ccg gtg aac ate gca cca ggt 
pro val asn ile ala pro gly 
121/41 

egg cca act cac aga cac cct 
arg pro thr his arg his pro 
181/61 

gtc gca teg ccg tec teg ccg 
val ala ser pro ser ser pro 
241/81 

egg get cga age caa gcg gcg 
arg ala arg ser gin ala ala 
301/101 

ccg cgc aga cca agg etc tea 
pro arg arg pro arg leu sec 









31/11 




gee 


tea 


cgc 


ccg gtc 


act 


ala 


ser 


arg 


pro val 


thr 








91/31 




tag 


gca 


gca 


ate ccg 


egg 


AMB 


ala 


ala 


ile pro 


arg 








151/51 




eta 


cga 


tgc 


agg gta 


tgc 


leu 


arg 


cys 


arg val 


cys 








211/71 




ccg 


tta 


gca 


teg ccg 


cca 


pro 


leu 


ala 


ser pro 


pro 








271/91 




gac 


cac 


ttc 


egg acg 


cga 


asp 


his 


phe 


arg thr 


arg 








331/111 




aga 


gcg 


cgc 


aca tgg 


Cgc 


arg 


ala 


arg 


thr trp 


cys 



SEQ ID N° 4 6B 
FIGURE 46B 



tct 
ser 


ccg 
pro 


cgt 
arg 


tec 
ser 


tea 
ser 


aca 
thr 


att 
ile 


acc 
thr 


cgc 
arg 


acc 
thr 


cca 
pro 


etc 
leu 


gee 
ala 


gac 
asp 


gga ccc 
gly pro 


cca 
pro 


gac 
asp 


gee 
ala 


act 
thr 


gee 
ala 


ctg 
leu 


teg 
ser 


ttg 
leu 


ccg 
pro 


get 
ala 


get cgt 
ala arg 


age 
ser 


cgc 
arg 


tgg 
trp 


Ccg 
ser 


agg 
arg 


agg 
arg 


cca 
pro 


tga 
OPA 


egg 
arg 


tea 
ser 


acg 
thr 


gca 
ala 


aga 
arg 


tc 



FEUILLE DE REMPLACEMENT (REGLE 26) 




WO 99/09186 ^PPCT/FR98/01813 

155/185 



1/1 






gcc gcg 


ccg 


cat 


ala ala 


pro 


his 


61/21 






egg tga 


aca 


teg 


arg OPA 


thr 


ser 


121/41 






ggc caa 


etc 


aca 


gly gin 


leu 


thr 


181/61 






teg cat 


cgc 


cgt 


ser his 


arg 


arg 


241/81 






ggg etc 


gaa 


gcc 


gly leu 


glu 


ala 


301/101 






cgc gca 


gac 


caa 


arg ala 


asp 


gin 



cga cca ggg cct 
arg pro gly pro 

cac cag gtt agg 
his gin val arg 

gac ace etc tac 
asp thr leu tyr 

cct cgc cgc cgt 
pro arg arg arg 

aag egg egg ace 
lys arg arg thr 

ggc tct caa gag 
gly ser gin glu 







31/11 


cac 


gcc 


egg tea 


his 


ala 


arg ser 






91/31 


cag 


caa 


tec cgc 


gin 


gin 


ser arg 






151/51 


gat 


gca 


ggg tat 


asp 


ala 


gly tyr 






211/71 


tag 


cat 


cgc cgc 


AMB 


his 


arg arg 






271/91 


act 


tec 


gga cgc 


thr 


ser 


gly arg 






331/111 


cgc 


gca 


cat ggt 


arg 


ala 


his gly 



ctt etc cgc gtt 
leu leu arg val 

gga ccc gca ccc 
gly pro ala pro 

gcg gac ccc cag 
ala asp pro gin 

cac tgt cgt tgc 
his cys arg cys 

gaa gcc get ggt 
glu ala ala gly 

get gac ggt caa 
ala asp gly gin 



cct caa caa ttc 
pro gin gin phe 

cac teg ccg ace 
his ser pro thr 

acg cca ctg ccg 
thr pro leu pro 

egg ctg etc gtc 
arg leu leu val 

cga gga ggc cac 
arg gly gly his 

egg caa gat c 
arg gin asp 



SEQ ID N* 46C 
FIGURE 46C 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 




PCT/FR98/01813 



156/165 



Sequence codante Rvl4Uc predite par Cole et al., 1998 (Nature 393: 537-544} et 
contenant seq46A: 



1/1 


















31/11 


















atg egg 
Met arg 
61/21 


acc 
thr 


ccc 
pro 


aga 
arg 


cgc 
arg 


cac 
his 


tgc 
cys 


cgt 
arg 


cgc 
arg 


ate gcc 
ile ala 
91/31 


gtc 
val 


etc 
leu 


gcc 
ala 


gcc 
ala 


gtt 
val 


age 
ser 


ate 
ile 


gcc 
ala 


gcc act 
ala thr 
121/41 


gtc 
val 


gtt 
val 


gcc 
ala 


ggc 
gly 


tgc 
cys 


teg 
ser 


teg 
ser 


ggc 
gly 


teg aag 
ser lys 
151/51 


cca 
pro 


age 
ser 


gly 


aaa 

S3** 

gly 


cca 
pro 


ctt 
leu 


ccg 
pro 


asp 


gcg aag 
ala lys 
181/61 


ccg 
pro 


ctg 
leu 


gtc 
val 


gag 
glu 


gag 
glu 


gcc 
ala 


acc 
thr 


gcg 
ala 


cag acc 
gin thr 
211/71 


aag 
lys 


get 
ala 


etc 
leu 


aag 
lys 


age 
ser 


gcg 
ala 


cac 
his 


atg 
met 


gtg ctg 
val leu 
241/81 


acg 
thr 


gtc 
val 


aac 
asn 


ggc 

gly 


aag 
lys 


ate 
ile 


ccg 
pro 


gga 
gly 


ctg tct 
leu ser 
271/91 


ctg 
leu 


aag 
lys 


aca 
thr 


ctg 
leu 


age 
ser 


ggc 
gly 


gat 
asp 


leu 


acc acc 
thr thr 
301/101 


aac 
asn 


ccc 
pro 


acc 
thr 


gcc 
ala 


gcg 
ala 


acg 
thr 


gga 
gly 


aac 
asn 


gtc aag 
val lys 
331/111 


etc 
leu 


acg 
thr 


eta 
leu 


cot 
gly 


ggg 

gly 


tct 
ser 


asp 


ate 

ile 


gat gcc 
asp ala 
361/121 


gac 
asp 


ttc 
phe 


gtg 
val 


gtg 
val 


ttc 
phe 


gac 
asp 


ggg 

gly 


ate 
ile 


ctg tac 
leu tyr 
391/131 


gcc 
ala 


acc 
thr 


ctg 
leu 


acg 
thr 


ccc 
pro 


aac 
asn 


cag 
gin 


f- rr <r 

trp 


age gat 
ser asp 
421/141 


ttc 
phe 


ggt 
gly 


ccc 
pro 


gcc 
ala 


gcc 
ala 


gac 
asp 


ate 
ile 


tac 
tyr 


gac ccc 
asp pro 
451/151 


gcc 
ala 


cag 
gin 


gtg 
val 


ctg 
leu 


aat 
asn 


ccg 
pro 


gat 
asp 


acc 
thr 


ggc ctg 
gly leu 
481/161 


gcc 
ala 


aac 
asn 


gtg 
val 


ctg 
leu 


gcg 
ala 


aat 

asn 


ttc 
phe 


gcc 
ala 


gac gca 
asp ala 
511/171 


aaa 

lys 


gcc 
ala 


gaa 
glu 


ggg 

gly 


egg gat 
arg asp 


acc 
thr 


ate 
ile 


aac ggc 
asn gly 
541/181 


cag 
gin 


aac 
asn 


acc 
thr 


ate 
ile 


cgc 
arg 


ate 
ile 


age 
ser 


ggg 

gly 


aag gta 
lys val 
571/191 


teg 
ser 


gca 
ala 


cag 
gin 


gcg 
ala 


gtg 
val 


aac 
asn 


cag 
gin 


ata 
ile 


gcg ccg 
ala pro 
601/201 


ccg 
pro 


ttc 
phe 


aac 
asn 


gcg 
ala 


acg 
thr 


cag 
gin 


ccg 
pro 


gtg 
val 


ccg gcg 
pro ala 
631/211 


acc 
thr 


gtc 

val 


tgg 
trp 


att 
ile 


cag 
gin 


gag 
glu 


acc 
thr 


ggc 
gly 


gat cat 
asp his 
661/221 


caa 
gin 


ctg 
leu 


gca 
ala 


cag 
gin 


gcc 
ala 


cag 
gin 


ttg 
leu 


gac 
asp 


cgc ggc 
arg gly 
691/231 


teg 
ser 


ggc 
gly 


aat 
asn 


tec 
ser 


gtc cag 
val gin 


atg 
met 


acc 
thr 


ttg teg 
leu ser 


aaa 
lys 


tgg 
trp 


ggc 

gly 


gag 
glu 


aag 
lys 


gtc 
val 


cag 
gin 


gtc 

val 


acg aag 
thr lys 


ccc 
pro 


ccg 
pro 


gtg 
val 


age 
ser 


tga 
OPA 









SEQ ID N* 46D 
FIGURE 4 6D 



FEUILLE DE REMPLACEMENT (REGLE 26) 




WO 99/09186 PCT/FR98/01813 



157/185 

ORF d'apres par Cole et al., 1998 (Nature 393: 537-544) 
et contenant la sequence codante Rvl411c: 

1/1 31/11 

etc ggc < 
leu gly 1 
91/31 
cac gec < 
his ala i 
151/51 
gat ggt < 
asp gly < 
211/71 
aac aat 1 
asn asn i 
271/91 
cgc cga < 
arg arg j 
331/111 
cac tgc t 
his cys i 
391/131 
tgc teg 1 
cys ser ; 
451/151 
gag gee a 
glu ala t 
511/171 
aag ate t 
lys ile i 
571/191 
gcg acg < 
ala the c 
631/211 
ttc gac < 
phe asp < 
691/231 
gec gac c 
ala asp j 
751/251 
gcg aat t 
ala asn i 
811/271 
cgc ate i 
arg ile < 
871/291 
acg cag c 
thr gin f 
931/311 
gec cag t 
ala gin ] 
991/331 



tga 
OPA 



tag etc 
AMB leu 
61/21 


ace 
thr 


cag gtt 
gin val 


gga 
gly 


ccg 
pro 


gtt 
val 


cag 
gin 


tgt 
cys 


gtc ggg 
val gly 
121/41 


eaa 
gin 


tac 
tyr 


ate 
ile 


gac 
asp 


gac 
asp 


cgt 
arg 


cag 
gin 


aca 
thr 


gec ggc 
ala gly 
181/61 


gtc 
val 


ggc ggt 
gly gly 


aac 
asn 


cat 
his 


egg 
arg 


acc 
thr 


gcg 
ala 


etc acg 
leu thr 
241/81 


ccc 
pro 


ggt cac 
gly his 


ttc 
phe 


tec 
ser 


gcg 
ala 


ttc 
phe 


etc 
leu 


ggc age 
gly ser 
301/101 


aat 
asn 


ccc 
pro 


gcg 
ala 


gac 
asp 


ccg 
pro 


cac 
his 


ccc 
pro 


act 
thr 


acg atg 
thr met 
361/121 


cag 
gin 


ggt atg 
gly met 


egg 
arg 


acc 
thr 


ccc 
pro 


aga 
arg 


cgc 
arg 


gtt age 
val ser 
421/141 


ate 
ile 


gee 
ala 


gec 
ala 


act 
thr 


gtc 
val 


gtt 
val 


gec 
ala 


ggc 
gly 


cca ctt 
pro leu 
481/161 


ccg 
pro 


gac 
asp 


gcg 
ala 


aag 
lys 


ccg 
pro 


ctg 
leu 


gtc 
val 


gag 
glu 


age gcg 
ser ala 
541/181 


cac 
his 


atg 
met 


gtg 
val 


ctg 
leu 


acg 
thr 


gtc 
val 


aac 
asn 


ggc 
gly 


age ggc 
ser gly 
601/201 


gat 
asp 


etc 
leu 


acc 
thr 


acc 
thr 


aac 
asn 


ccc 
pro 


acc 
thr 


gec 
ala 


ggg tct 
gly ser 
661/221 


gat 
asp 


ate 
ile 


gat 
asp 


gec 
ala 


gac 
asp 


ttc 
phe 


gtg 
val 


gtg 
val 


ccc aac 
pro asn 
721/241 


cag 
gin 


tgg 
trp 


age 
ser 


gat 
asp 


ttc 
phe 


ggt 
gly 


ccc 
pro 


gee 
ala 


aat ccg 
asn pro 
781/261 


gat 
asp 


acc ggc 
thr gly 


ctg 
leu 


gec 
ala 


aac 
asn 


gtg 
val 


ctg 
leu 


egg gat 
arg asp 
841/281 


acc 
thr 


ate 
ile 


aac 
asn 


ggc 

gly 


cag 
gin 


aac 
asn 


acc 
thr 


ate 
ile 


gtg aac 
val asn 
901/301 


cag 

gin 


ata 
ile 


gcg 
ala 


ccg 
pro 


ccg 
pro 


ttc 
phe 


aac 
asn 


gcg 
ala 


cag gag 
gin glu 
961/321 


acc 
thr 


ggc gat 
gly asp 


cat 
his 


caa 
gin 


ctg 
leu 


gca 
ala 


cag 
gin 


gtc cag atg 
val gin met 
1021/341 


acc 
thr 


ttg 
leu 


teg 
ser 


aaa 
lys 


tgg 
trp 


ggc 
gly 


gag 
glu 



cac 
his 


gtc 
val 


ggc 
gly 


ggt 
gly 


gaa 
glu 


ttg 
leu 


gee 
ala 


gac 
asp 


age 
ser 


gat 
asp 


cga 
arg 


gtc 
val 


gec 
ala 


gtg 
val 


ccg 
pro 


cgc 
arg 


cgc 
arg 


ate 
ile 


gac 
asp 


cag 
gin 


ggc 
gly 


ggt gaa 
gly glu 


cat 
his 


cgc 
arg 


acc 
thr 


agg 
arg 


tta 
leu 


gee 
ala 


aac 
asn 


tea 
ser 


cag 
gin 


aca 
thr 


ccc 
pro 


tct 
ser 


cgc 
arg 


ate 
ile 


gec 
ala 


gtc 
val 


etc 
leu 


gec 
ala 


gee 
ala 


ggc 
gly 


teg 
ser 


aag 
lys 


cca 
pro 


age 
ser 


ggc 
gly 


gga 
gly 


gcg cag 
ala gin 


acc 
thr 


aag 
lys 


get 
ala 


etc 
leu 


aag 

lys 


gga ctg 
gly leu 


tct 
ser 


ctg 
leu 


aag 
lys 


acg 
thr 


ctg 
leu 


aac 
asn 


gtc 
val 


aag 
lys 


etc 
leu 


acg 
thr 


ctg 
leu 


ggt 
gly 


ate 
ile 


ctg 
leu 


tac 
tyr 


gec 
ala 


acc 
thr 


ctg 
leu 


acg 
thr 


tac 
tyr 


gac 
asp 


ccc 
pro 


gec 
ala 


cag 
gin 


gtg 
val 


ctg 
leu 


gee 
ala 


gac 
asp 


gca 
ala 


aaa 
lys 


gee 
ala 


gaa 
glu 


ggg 

gly 


ggg aag 
gly lys 


gta 
val 


teg 
ser 


gca 
ala 


cag 

gin 


gcg 
ala 


gtg 
val 


ccg 
pro 


gcg 
ala 


acc 
thr 


gtc 
val 


tgg 
trp 


att 
ile 


gac 
asp 


cgc 
arg 


ggc 
gly 


teg 
ser 


ggc 
gly 


aat 
asn 


tec 
ser 


gtc 
val 


acg 
thr 


aag 
lys 


ccc 
pro 


ccg 
pro 


gtg 
val 


age 
sec 



SEQ ID N° 46F 



FEUILLE DE REMRLWttESIEN* 3{REGLE 26) 



WO 99/09186 




PCT/FR98/01813 



158/185 



1/1 

gag ctg gtc aac ggc gcc ggc 
glu leu val asn gly ala gly 
61/21 

ctg gcc gat gcc cag cag atg 
leu ala asp ala gin gin met 
121/41 

gtg ttg gtg gcc teg ggc age 
val leu val ala ser gly ser 
181/61 

ttc gac get gtg atg gac gcg 
phe asp ala val met asp ala 
241/81 

egg gtg ctg etc gag cag ggt 
arg val leu leu glu gin gly 
301/101 

ggg ttg ggc aat gcc gcc ggt 
gly leu gly asn ala ala gly 







31/11 




ate gac 


gac 


gcc gcc gtc 


ile asp 


asp 


ala ala 


val 






91/31 




gtc gag 


gcg 


gca ctg 


ggc 


val glu 


ala 


ala leu 


gly 






151/51 




aac cat 


gtg 


gcg ccc 


att 


asn his 


val 


ala pro 


ile 






211/71 




aac gtg 


egg 


ggt gcc 


tgg 


asn val 


arg 


gly ala trp 






271/91 




cag ggc 


ggc 


age gtg 


gtg 


gin gly 


gly 


ser val 


val 






331/111 




tac age 


gcg 


tac tgc 


ccg 


tyr ser 


ala 


tyr cys 


pro 



SEQ ID N° 47A 
FIGURE 47A 



gtg 
val 


acc tgc 
thr cys 


egg 
ara 


ccg gac 
oro aso 


age 
ser 


eg a 
arg 


tat ggc 
tyr gly 


cgt 
arg 


ttg gac 
leu asp 


gga 
gly 


acc 
thr 


gag atg 
glu met 


gcc 
ala 


gtc gag 
val glu 


gac 
asp 


ctg 
leu 


gtg tgt 
val cys 


egg 
arg 


gcg gcc 
ala ala 


gga 
gly 


ctg 
leu 


gtg teg 
val ser 


tec 
ser 


gtt cgc 
val arg 


ggc 
gly 


teg 
ser 


aag gcg 
lys ala 


ggc 
gly 


acc gat 
thr asp 


c 



1/1 

age tgg tea acg gcg ccg gca 
ser trp ser .thr ala pro ala 
61/21 

tgg ccg atg ccc age aga tgg 
trp pro met pro ser arg trp 
121/41 

tgt tgg tgg cct egg gca gca 
cys trp trp pro arg ala ala 
181/61 

teg acg ctg tga tgg acg cga 
ser thr leu OPA trp thr arg 
241/81 

ggg tgc tgc teg age agg gtc 
gly cys cys ser ser arg val 
301/101 

ggt tgg gca atg ccg ccg gtt 
gly trp ala met pro pro val 









31/11 






teg 


acg 


acg 


ccg ccg 


teg 


tga 


ser 


thr 


thr 


pro pro 


ser 


OPA 








91/31 






teg 


agg 


egg 


cac tgg 


gcc gat 


ser 


arg 


arg 


his trp 


ala 


asp 








151/51 






acc atg 


tgg 


cgc cca 


tta 


ccg 


thr met 


trp 


arg pro 


leu 


pro 








211/71 






acg 


tgc 


ggg 


gtg cct 


ggc 


tgg 


thr 


cys 


gly 


val pro 


gly trp 








271/91 






agg 


gcg 


gca 


gcg tgg 


tgc 


tgg 


arg 


ala 


ala 


ala trp 


cys 


trp 








331/111 






aca 


gcg 


cgt 


act gcc 


cgt 


cga 


thr 


ala 


arg 


thr ala 


arg 


arg 



SEQ ID N° 47B 
FIGURE 47B 



cct 
pro 


gcc 
ala 


ggc 
gly 


egg aca 
arg thr 


gcc 
ala 


atg 
met 


gcc 
ala 


gtt 
val 


tgg acg 
trp thr 


gag 
glu 


aga tgg 
arg trp 


ccg 
pro 


teg agg 
ser arg 


act 
thr 


tgt 
cys 


gtc 
val 


ggg 

gly 


egg ccg 
arg pro 


gac 
asp 


tgt cgt 
cys arg 


ccg 
pro 


ttc gcg 
phe ala 


gcg 
ala 


agg 
arg 


egg 
arg 


gca 
ala 


ccg ate 
pro ile 





FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



159/185 



1/1 








get ggt 


caa 


egg 


cgc 


ala gly 


gin 


arg 


arg 


61/21 








ggc cga 


tgc 


cca 


gca 


gly arg 


cys 


pro 


ala 


121/41 








gtt ggt 


ggc 


etc 


ggg 


val gly 


gly 


leu 


gly 


181/61 






cga cgc 


tgt 


gat gga 


arg arg 


cys 


asp gly 


241/81 








ggt get 


get 


cga 


gca 


gly ala 


ala 


arg 


ala 


301/101 






gtt ggg 


caa 


tgc 


cgc 


val gly 


gin 


cys 


arg 



egg cat cga cga cgc 
arg his arg arg arg 

gat ggt cga ggc ggc 
asp gly arg gly gly 

cag caa cca tgt ggc 
gin gin pro cys gly 

cgc gaa cgt gcg ggg 
arg glu arg ala gly 

ggg tea ggg egg cag 
gly ser gly arg gin 

egg tta cag cgc gta 
arg leu gin arg val 



31/11 

cgc cgt cgt gac ctg 
arg arg arg asp leu 
91/31 

act ggg ccg ata tgg 
thr gly pro ile trp 
151/51 

gcc cat tac cga gat 
ala his tyr arg asp 
211/71 

tgc ctg get ggt gtg 
cys leu ala gly val 
271/91 

cgt ggt get ggt gtc 
arg gly ala gly val 
331/111 

ctg ccc gtc gaa ggc 
leu pro val glu gly 



ccg 
pro 


gcc 
ala 


gga 
gly 


cag 
gin 


cct 
pro 


ccg 
pro 


ttt 
phe 


gga 
gly 


egg 
arg 


agt 
ser 


ggc 
gly 


cgt 
arg 


cga 
arg 


gga 
gly 


ctt 
leu 


teg 
ser 


ggc 
gly 


ggc 
gly 


egg 
arg 


a eg 
thr 


gtc 
val 


cgt 
arg 


teg 
ser 


egg 
arg 


egg 
arg 


ggg 

gly 


cac 
his 


cga 
arg 


tc 





SEQ ID N° 47C 
FIGURE 47G 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 




PCI7FR98/01813 



160/185 



Sequence codante Rvl714 predite par Cole et al . , 1998 (Nature 393: 537-544) et 
contenant seq 47A: 



1/1 










gtg gag 
val glu 
61/21 


gaa 
glu 


atg 
met 


gcg 

ala 


ctg 
leu 


cag gac 
gin asp 
121/41 


aag 
lys 


teg 
ser 


ate 
ile 


ctg 
leu 


gcg ctg 
ala leu 
181/61 


gcc 
ala 


gac 
asp 


gcg 
ala 


gga 
gly 


gag ctg 
glu leu 
241/81 


gtc 
val 


aac 
asn 


ggc 
gly 


gcc 
ala 


ctg gcc 
leu ala 
301/101 


gat 
asp 


gcc 
ala 


cag 
gin 


cag 
gin 


gtg ttg 
val leu 
361/121 


gtg 
val 


gcc 
ala 


teg 
ser 


ggc 
gly 


ttc gac 
phe asp 
421/141 


get 
ala 


gtg 
val 


atg 
met 


gac 
asp 


egg gtg 
arg val 
481/161 


ctg 
leu 


etc 
leu 


gag 
glu 


cag 
gin 


ggg ttg 
gly leu 
541/181 


ggc 
gly 


aat 
asn 


gcc 
ala 


gcc 
ala 


ttg gcc 
leu ala 
601/201 


aag 
lys 


aca 
thr 


ttg 
leu 


gcg 
ala 


ccg acg 
pro thr 
661/221 


gtg 
val 


ttt 
phe 


egg 
arg 


tec 
ser 


gcc acc 
ala thr 
721/241 


egg 
arg 


gag 
glu 


gcg 
ala 


atg 
met 


ttc gtc 
phe val 
781/261 


ggc 
gly 


gcc 
ala 


ctg 
leu 


ate 
ile 


atg tat 
met tyr 


ctg 
leu 


gac 
asp 


ggc 
gly 


ggg 

gly 











31/11 


get 


cag 


cag 


gtg 


ccg aac ctg 


ala 


gin 


gin 


val 


pro asn leu 










91/31 


ate 


acc 


ggc 


gcg 


acc ggt teg 


ile 


thr 


glv 


ala 


thr gly ser 










151/51 


gcg 


egg 


eta 


aca 


cfco acc nrrc 


ala 


arg 


leu 


thr 


leu ala rrl w 










2H/71 


ggc 


ate 


gac 


gac 


occ acc crhr 


gly 


ile 


asp 


aso 


ala ala val 










271/91 


atg 


gtc 


gag 


gcg 


gca eta aac 


met 


val 


glu 


ala 


ala leu gly 










331/111 


age 


aac 


cat 


gtg 


gcg ccc att 


ser 


asn 


his 


val 


ala pro ile 










391/131 


gcg 


aac 


gtg 

V w 3 


egg 


ggt acc too 


ala 


asn 


val 


arg 


gly ala trp 










451/151 


ggt 


cag 


ggc 


ggc 


age gtg eta 


gly 


gin 


glv 


glv 


ser va 1 va 1 










511/171 


ggt 


tac 


age 


gcg 


tac tgc ccg 


gly 


tyr 


ser 


ala 


tyr cys pro 










571/191 


gcc 


gaa 


tgg 


ggc 


ggt cac ggc 


ala 


glu 


trp 


gly 


gly his gly 










631/211 


gcg 


gtg 


acc 


gag 


tgg atg ttc 


ala 


val 


thr 


glu 


trp met phe 










691/231 


etc 


gcc 


egg 


ate 


ccg ttg cgc 


leu 


ala 


arg 


ile 


pro leu arg 










751/251 


tat 


ctg 


etc 


age 


gac gcc teg 


tyr 


leu 


leu 


ser 


asp ala ser 










811/271 


tac 


acc 


gca 


tgc 


tga 


tyr 


thr 


ala 


cys 


OPA 



SEQ ID N° 47D 
FIGURE 47D 



ggt 
gly 


ctg 
leu 


gcg 
ala 


cgc ttc 
arg phe 


age 
ser 


gtg 
val 


ttg 
leu 


ggc 
gly 


cga 
arg 


gtt gcc 
val ala 


gcc 
ala 


egg 
arg 


ggc 
gly 


aac 
asn 


teg 
ser 


gcc ggt 
ala gly 


ctg 
leu 


gcc 
ala 


gtg 
val 


acc 
thr 


tgc 
cys 


egg ccg 
arg pro 


gac 
asp 


age 
ser 


cga 
arg 


tat 
tyr 


ggc 
gly 


cgt ttg 
arg leu 


gac 
asp 


gga 
gly 


acc 
thr 


gag 
glu 


atg 
met 


gcc gtc 
ala val 


gag 
glu 


gac 
asp 


ctg 
leu 


gtg 
val 


tgt 

CVS 


egg gcg 
arg ala 


gcc 
ala 


gga 


ctg 
leu 


gtg 
val 


teg 
ser 


tec gtt 
ser val 


cgc 
arg 


ggc 
gly 


teg 
ser 


aag 
lys 


gcg 
ala 


ggc acc 
gly thr 


gat 
asp 


ctg 
leu 


att 
ile 


egg 
arg 


gtg 
val 


aac gcg 
asn ala 


ctg 
leu 


gcg 
ala 


acc 
thr 


gac 
asp 


gat 
asp 


ccg aag 
pro lys 


ggc 
gly 


egg 
arg 


cgc 
arg 


ttc 
phe 


gcc 
ala 


gaa ccg 
glu pro 


gaa 
glu 


gac 
asp 


age 
ser 


ttc 
phe 


tac 
tyr 


acc ggc 
thr gly 


cag 
gin 


gtg 
val 



FEUILLE DE REM PLACEM ENT (REGLE 26) 



WO 99/09186 




T/FR98/01813 



161/185 



ORF d'apres Cole et al., 1998 (Nature 393: 537-544) et contenant la sequence 
codante Rvl714: 



24/1 


















54/11 


















tag gtg 


gag 


gaa 


atg 


gcg 


ctg 


get 


cag 


cag 


gtg ccg 


aac 


ctg 


ggt 


ctq 


aca 


cac 


ttc 


aac 


AMB val 


glu 


glu 


met 


ala 


leu 


ala 


gin 


gin 


val pro 


asn 


leu 


gly 


leu 


ala 


arg 


phe 


ser 


84/21 


















114/31 












gtg cag 


gac 


aag 


teg 


ate 


ctg 


ate 


acc 


ggc 


gcg acc 


ggt 


teg 


ttg 


ggc 


cqa 


qtt 


acc 


acc 


val gin 


asp 


lys 


ser 


ile 


leu 


ile 


thr 


gly 


ala thr 


gly 


ser 


leu 


gly 


arg 


val 


ala 


ala 


144/41 


















174/51 












egg gcg 


ctg 


gee 


gac 


gcg 




gcg 


egg 


ctg 


aca ctg 


gee 


ggc 


ggc 


aac 


tea 


acc 


aat 


eta 


arg ala 


leu 


ala 


asp 


ala 


gly 


ala 


arg 


leu 


thr leu 


ala 


gly 


gly 


asn 


ser 


ala 


gly 


leu 


204/61 


















234/71 












gec gag 


ctg 


gtc 


aac 


ggc 


gee 


ggc 


ate 


gac 


gac gee 


gec 


gtc 


gtg 


acc 


tgc 


egg 


ccq 


aac 


ala glu 


leu 


val 


asn 


gly 


ala 


gly 


ile 


asp 


asp ala 


ala 


val 


val 


thr 


cys 


arg 


pro 


asp 


264/81 


















294/91 










age ctg 


gee 


gat 


gee 


cag 


cag 


atg 


gtc 


gag 


gcg gca 


ctg 


ggc 


eg a 


tat 


QQC 


cat 


tta 


gac 


ser leu 


ala 


asp 


ala 


gin 


gin 


met 


val 


glu 


ala ala 


leu 


gly 


arg 


tyr 


gly 


arg 


leu 


asp 


324/101 


















354/111 








gga gtg 


ttg 


gtg 


gee 


teg 


ggc 


age 


aac 


cat 


gtg gcg 


ccc 


att 


acc 


gag 


atg 


gee 


gtc 


aaa 


gly val 


leu 


val 


ala 


ser 


gly 


ser 


asn 


his 


val ala 


pro 


ile 


thr 


glu 


met 


ala 


val 


glu 


.384/121 


















414/131 














gac ttc 


gac 


get 


gtg 


atg 


gac 


gcg 


aac 


gtg 


egg ggt 


gec 


tgg 


ctg 


gtg 


tqt 


caa 


aca 


acc 


asp phe 


asp 


ala 


val 


met 


asp 


ala 


asn 


val 


arg gly 


ala 


trp 


leu 


val 


cys 


arg 


ala 


ala 


444/141 


















474/151 












gga egg 


gtg 


ctg 


etc 


gag 


cag 


ggt 


cag 


ggc 


ggc age 


gtg 


gtg 


ctg 


gtg 


teg 


tec 


att 


cac 


gly arg 


val 


leu 


leu 


glu 


gin 


gly 


gin 


gly 


gly ser 


val 


val 


leu 


val 


ser 


ser 


val 


ara 


504/161 


















534/171 
















ggc ggg 


ttg 


ggc 


aat 


gee 


gee 


ggt 


tac 


age 


gcg tac 


tgc 


ccg 


teg 


aag 


gcg 


ggc 


acc 


gat 


gly gly 


leu 


gly 


asn 


ala 


ala 


gly 


tyr 


ser 


ala tyr 


cys 


pro 


ser 


lys 


ala 


gly 


thr 


asp 


564/181 


















594/191 










ctg ttg 


gee 


aag 


aca 


ttg 


gcg 


gee 


gaa 


tgg 


ggc ggt 


cac 


ggc 


att 


egg 


gtg 


aac 


gcg 


ctg 


leu leu 


ala 


lys 


thr 


leu 


ala 


ala 


glu 


trp 


gly gly 


his 


gly 


ile 


arg 


val 


asn 


ala 


leu 


624/201 


















654/211 














gcg ccg 


a eg 


gtg 


ttt 


egg 


tec 


gcg 


gtg 


acc 


gag tgg 


atg 


ttc 


acc 


gac 


gat 


ccg 


aag 


ggc 


ala pro 


thr 


val 


phe 


arg 


ser 


ala 


val 


thr 


glu trp 


met 


phe 


thr 


asp 


asp 


pro 


lys 


gly 


684/221 


















714/231 










egg gee 


ace 


egg 


gag 


gcg 


atg 


etc 


gee 


egg 


ate ccg 


ttg 


cgc 


cgc 


ttc 


gec 


gaa 


ccg 


gaa 


arg ala 


thr 


arg 


glu 


ala 


met 


leu 


ala 


arg 


ile pro 


leu 


arg 


arg 


phe 


ala 


glu 


pro 


glu 


744/241 


















774/251 












gac ttc 


gtc 


ggc 


gee 


ctg 


ate 


tat 


ctg 


etc 


age gac 


gee 


teg 


age 


ttc 


tac 


acc 


ggc 


cag 


asp phe 


val 


gly 


ala 


leu 


ile 


tyr 


leu 


leu 


ser asp 


ala 


ser 


ser 


phe 


tyr 


thr 


gly 


gin 


804/261 


















834/271 










gtg atg 


tat 


ctg 


gac 


ggc 


ggg 


tac 


acc 


gca 


tgc tga 


















val met 


tyr 


leu 


asp 


gly 


gly 


tyr 


thr 


ala 


cys OPA 



















SEQ ID N° 47F 
FIGURE 47F 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 




PC17FR98/01813 



162/185 



1/1 31/11 

agg etc atg age aag acg gtt etc ate ctt ggc gcg ggt gtc ggc ggc ctg ace ace gee 

arg leu met ser lys thr val leu ile leu gly ala gly val gly gly leu thr thr ala 

61/21 91/31 

gac acc etc cgt caa ctg eta cca cct gag gat c 

asp thr leu arg gin leu leu pro pro glu asp 



SEQ ID N° 48A 
FIGURE 48A 



1/1 

ggc tea tga gca aga egg ttc 
gly ser OPA ala arg arg phe 
61/21 

aca ccc tec gtc aac tgc tac 
thr pro ser yal asn cys tyr 



31/11 

tea tec ttg gcg egg gtg 
ser ser leu ala arg val 

91/31 
cac ctg agg ate 
his leu arg ile 



SEQ ID N Q 48B 
FIGURE 48B 



teg gcg gec tga cca ccg ccg 
ser ala ala OPA pro pro pro 



1/1 31/11 

get cat gag caa gac ggt tct cat cct tgg cgc ggg tgt egg egg cct gac cac cgc cga 
ala his glu gin asp gly ser his pro trp arg gly cys arg arg pro asp his arg arg 
61/21 

cac cct ccg tea act get acc acc tga gga tc 
his pro pro ser thr ala thr thr OPA gly 



SEQ ID N 9 48C 
FIGURE 48C 



FEUILLE DE REMPLACEMENT (REGLE 26) 




WO 99/09186 ^FPCT/FR98/01813 



163/185 



Sequence codante Rv0331 predite par Cole et al., 1998 (Nature 393: 537-544) et contenant 
seq48A: 



1/1 








ata aac 


aacr 


aca 


gtt 


Met ser 


lys 


thr 


val 


61/21 






etc cgt 


caa 


eta 


eta 


leu arg 


gin 


leu 


leu 


121/41 








acg ctg 


aac 


tta 

w w V 


teg 


thr leu 


gly 


leu 


ser 


181/61 






gtc cgc 


ccc 


acc 


aca 

3 3 


val arg 


pro 


thr 


ala 


241/81 








att gac 


ate 


gcg 


gcc 


ile asp 


ile 


ala 


ala 


301/101 








gtg ate 


gca 


tta 


ggt 


val ile 


ala 


leu 


giy 


361/121 






gac gcc 


gac 


gtc 


gcg 


asp ala 


asp 


val 


ala 


421/141 








gtc gag 


gcg 


etc 


aaa 

33 


val glu 


ala 


leu 


glu 


481/161 






cca gcc 


oca 


CCG 


ttc 


pro ala 


ala 


pro 


phe 


541/181 








acc gga 


acc 


gta 


cag 


thr gly 


thr 


val 


gin 


601/201 








ccc gag 


gtc 


ggc 


gag 


pro glu 


val 


giy 


glu 


661/221 








cgc aag 


gcc 


eta 


get 


arg lys 


ala 


leu 


ala 


721/241 








tec gaa 


ccg 


ttc 


gat 


ser glu 


pro 


phe 


asp 


781/261 








tea gcg 


ggt 


etc 


age 


ser ala 


gly 


leu 


ser 


841/281 








gcc gac 


aac 


gtg 


tgg 


ala asp 


asn 


val 


trp 


901/301 








ctg ccc 


aag 


get 


gcc 


leu pro 


lys 


ala 


ala 


961/321 








cgc cat 


etc 


ggt 


tac 


arg his 


leu 


gly 


tyr 


1021/341 






gag acc 


ggt 


gat 


cac 


glu thr 


gly 


asp 


his 


1081/361 






teg gtg acg 


ctg 


tac 


3er val 


thr 


leu 


tyr 


1141/381 




gcc tgg ctg 


acc 


cgc 


ala trp leu 


thr 


arg 



etc ate ctt ggc gcg 
leu ile leu gly ala 

cca cct gag gat eg a 
pro pro glu asp arg 

ttg eta tgg gtg ttg 
leu leu trp val leu 

gcg teg ctg ccc ggt 
ala ser leu pro gly 

cag gta gtg cac acc 
gin val val his thr 

gcg gcg ctg aac acc 
ala ala leu asn thr 

ggc cag ttc tac acc 
gly gin phe tyr thr 

cat ggc egg ate get 
his gly arg ile ala 

gaa gcg gcg ttt ctg 
glu ala ala phe leu 

ate gac acg ttc acg 
ile asp thr phe thr 

get ttg gtc teg atg 
ala leu val ser met 

cgc gtc gat gag gcc 
arg val asp glu ala 

ctg ctt gcc gtg gtc 
leu leu ala val val 

gaa tec ggg tgg ata 
glu ser gly trp ile 

gcc ate ggc gat gcg 
ala ile gly asp ala 

gtg ttc gcc gaa gcc 
val phe ala glu ala 

gac gta get gag cgc 
asp val ala glu arg 

cag gca gcc aag ggc 
gin ala ala lys gly 

ccg ccg teg egg gag 
pro pro ser arg glu 

tgg aag acg tga 
trp lys thr OP A 



31/11 








yy y 


ggc 


ggc 


ctg 


alv val 


y^y 


gly 


leu 


91/31 








ate ata 


teg 


gtg 


gac 


ile ile 


leu 


val 


asp 


151/51 






can cine 

*-yy yy'-* 


tgg 


egg 


egg 


arc alv 


trn 


arg 


arg 


211/71 










Afrr 


gtt 


act 


val glu 


met 


val 


thr 


271/91 








aac aac 


age 


gtc 




asp asn 


ser 


val 


ile 


331/111 








cac cree 

*7 W VjJ vV# 


y«- u 


ccc 


gga 


asp ala 


val 


oro 


y J 


391/131 






ctcr aac 


n etc 


gcg 


get 


leu asp 


al V 


ala 


ala 


451/151 








y**y yv*v» 


ate 


gcc 


ggg 


val ala 


ile 


ala 


gxy 


511/171 






ate acc 


ate 


caa 


etc 


ile ala 


ala 


gin 


leu 


571/191 






cct aac 


ccet 
teg 


ccg 


ccg 


pro asp 


oro 


leu 


nrn 


6317211 








etc aag 


gat 


cac 


ggt 


leu lys 


aso 


his 


alv 


691/231 






oca aaa 


acg 


atg 


cac 


ala arg 


thr 


met 


his 


751/251 








ccc ccg 


cac 


ata 
y ^y 


ccc 


pro pro 


his 


val 


oro 


811/271 








ccc gtg 


gac 


ccg 


cgc 


pro val 


asp 


pro 


arg 


871/291 








acc gtg 


ctg 


acg 


ctg 


thr val 


leu 


thr 


leu 


931/311 








cag gcc 


gca 


gtt 


gtc 


gin ala 


ala 


val 


val 


991/331 








cac ttc 


acc 


ggc 


acg 


his phe 


thr 


gly 


thr 


1051/351 




gac ggc gat 


ttc 


ttc 


asp gly asp 


phe 


phe 


1111/371 






ttt cac 


gag 


gag 


aag 


phe his glu 


glu 


lys 



acc 
thr 


acc 
thr 


gcc 
ala 


gac 
asp 


acc 
thr 


agg 
arg 


age 
ser 


ttt 
phe 


gac 
asp 


ggg 

gly 


cct 
pro 


gac 
asp 


gac 
asp 


gtc 
val 


cgc 
arg 


gca 
ala 


acc 
thr 


gtc 
val 


gcc 
ala 


cac 
his 


ggc 
gly 


tat 
tyr 


gac 
asp 


gcg 
ala 


ttg 
leu 


ctg 
leu 


teg 
ser 


gac 
asp 


gcg 
ala 


etc 
leu 


gag 
glu 


ctg 
leu 


cgt 
arg 


gcg 
ala 


aag 
lys 


gtg 
val 


ccg 
pro 


ttc 
phe 


aaa 
lys 


tgc 
cys 


ggt 
gly 


gac 
asp 


cgc 
arg 


tac 
tyr 


gcc 
ala 


atg 
met 


ccc 
pro 


gtt 
val 


gca 
ala 


ggt 

gly 


gtc 
val 


ggc 
gly 


ttc 
phe 


cat 
his 


cct 
pro 


ttc 
phe 


ggt 

gly 


gac 
asp 


ggc 
gly 


acg 
thr 


tec 
ser 


gcc 
ala 


gcg 
ala 


gcg 
ala 


egg 
arg 


acc 
thr 


ctg 
leu 


tec 
ser 


act 
thr 


age 
ser 


ccg 
pro 


aat 
asn 


ggc 
gly 


aaa 
lys 


ccg 
pro 


gcc 
ala 


cac 
his 


ggc 
gly 


gtc 
val 


gcc 
ala 


ggc 
gly 


gcc 
ala 


tgc 
cys 


tac 
tyr 


gtc 
val 


get 
ala 


ccg 
pro 


teg 
ser 


gcg 
ala 


ccc 
pro 


gtc 
val 


gca 
ala 


caa 
gin 


gaa 
glu 


ctg 
leu 



SEQ ID N° 48D 
FEUILLE DE REM^gEJIEIf^REGLE 26) 



WO 99/09186 




PCT/FR98/0I813 



164/185 



ORF d'apres Cole et al. r 1998 (Nature 393: 537-544) et contenant la sequence 
codante Rv0331: 



1/1 



tga aca 


ccc 


y *-y 


OP A thr 


pro 


Ala 

did 


61/21 






cca tgg 


gcc 


gat 


pro trp 


a! a. 
aid 


asp 


1?1 / A\ 






y G y gcg 


gaa 




axa ala 


glu 


ser 


181/61 






acre afia 


a eg 




del. lyo 


th r 


V a 1 
Val 


241/81 






cert caa 


ctg 


eta 


a. r*rf rt 1 n 


1CU 


leu 


301/101 






eta acc 


ttg 


tccr 


leu gly 


leu 


ser 


361/121 






cgc ccc 


acc 


gcg 


arg pro 


th r 

LIU 


ala 


421/141 






gac ate 


y *-y 


gcc 






ala 


481/161 






ate gca 


tta 


crert 
yy u 


ile ala 


leu 


alv 


541/181 






gcc gac 


gtc 


-gcg 


ala asp 


val 


ala 


601/201 






gag gcg 


etc 


gag 


glu ala 


leu 


glu 


661/221 






gcc gca 


ccg 


ttc 


ala ala 


pro 


phe 


721/241 






gga acc 


gta 


cag 


gly thr 


val 


gin 


781/261 






gag gtc 


ggc 


gag 


glu val 


gly 


glu 


841/281 






aag gcc 


eta 


get 


lys ala 


leu 


ala 



ccg acg egg cga 
pro thr arg arg 

aat agt ttg act 
asn ser leu thr 

aat att cca aag 
asn ile pro lys 

etc ate ctt ggc 
leu ile leu gly 

cca cct gag gat 
pro pro glu asp 

ttg eta tgg gtg 
leu leu trp val 

gcg teg ctg ccc 
ala ser leu pro 

cag gta gtg cac 
gin val val his 

gcg gcg ctg aac 
ala ala leu asn 

ggc cag ttc tac 
gly gin phe tyr 

cat ggc egg ate 
his gly arg ile 

gaa gcg gcg ttt 
glu ala ala phe 

ate gac acg ttc 
ile asp thr phe 

get ttg gtc teg 
ala leu val ser 

cgc gtc gat gag 
arg val asp glu 







31/11 


caa 


tea 


\-.y M Qua 


gin 


ser 


arg lys 








gac 


teg 


y u w ay u 


asp 


ser 


Vol OCL 






1 Si /SI 


ata 


tat 




ile 


tvr 

i-yr 


gly thr 






611/ / 1 


y c 9 


ggt 


guc ggc 


ala 


rrl xt 

yiy 


Va 1 rr 1 t/ 

vai y«*-Y 






271 /Q1 

6 / 1/ -7 J. 


Cga 


ate 


ata tug 


a. m 


lie 


ile leu 






JJX/ ill 


tta 


<-yy 


ggc tgg 


leu 


arg 


gly trp 






071/ 131 


cm t 

yy & 


nt rr 


gaa atg 


erl v 


val 


rr 1 11 ms»h 
yiu tuts u 






4S1 /I 

Ul/ iJl 


acc 


rra r* 
you 


aac age 


thr 


asp 


asn ser 






511 /l 71 

«J11/ X / 1 


acc 


gac 


cinr! rrt"t 
yi«v y l. i> 


thr 


asp 


ala va 1 
aj_a val 






571/191 


acc 


ctg 


gac ggc 


thr 


leu 


asp gly 






631/211 


get 


gtg 


get ate 


ala 


val 


ala ile 






691/231 


ctg 


ate 


gcc gcc 


leu 


ile 


ala ala 






751/251 


acg 


cct 


gac ccg 


thr 


pro 


asp pro 






811/271 


atg 


etc 


aag gat 


met 


leu 


lys asp 






871/291 


gcc 


gca 


agg acg 


ala 


ala 


arg thr 



acc ggt ccg egg 
thr gly pro arg 

cac ccc aag acc 
his pro lys thr 

cga tgc gaa gga 
arg cys glu gly 

ggc ctg acc acc 
gly leu thr thr 

gtg gac agg age 
val asp arg ser 

egg egg cct gac 
arg arg pro asp 

gtt act gca acc 
val thr ala thr 

gtc ate ggc tat 
val ile gly tyr 

ccc gga ctg teg 
pro gly leu ser 

gcg get gag ctg 
ala ala glu leu 

gcc ggg gtg ccg 
ala gly val pro 

caa etc ggt gac 
gin leu gly asp 

ctg ccg atg ccc 
leu pro met pro 

cac ggt gtc ggc 
his gly val gly 

atg cac ttc ggt 
met his phe gly 



gaa 
glu 


tgc 
cys 


tgc 
cys 


ggg 

gly 


ttg 
leu 


cgc 
arg 


aag 
lys 


act 
thr 


ate 
ile 


agg 
arg 


etc 
leu 


atg 
met 


gcc 
ala 


gac 
asp 


acc 
thr 


etc 
leu 


ttt 
phe 


gac 
asp 


ggg 

gly 


acg 
thr 


gac 
asp 


gtc 
val 


cgc 
arg 


gtc 
val 


gtc 
val 


gcc 
ala 


cac 
his 


att 
ile 


gac 

asp 


gcg 
ala 


ttg 
leu 


gtg 
val 


gac 
asp 


gcg 
ala 


etc 
leu 


gac 
asp 


cgt 
arg 


gcg 
ala 


aag 

lys 


gtc 
val 


ttc 
phe 


aaa 
lys 


tgc 
cys 


cca 
pro 


cgc 
arg 


tac 
tyr 


gcc 
ala 


acc 
thr 


gtt 
val 


gca 
ala 


ggt 
gly 


ccc 
pro 


ttc 
phe 


cac 
his 


cct 
pro 


cgc 
arg 


gac 
asp 


ggc 
gly 


acg 
thr 


tec 
ser 



SEQ ID N° 48F 
FIGURE 48F 

FEUILLE DE REM PLACEMENT (REGLE 26) 




165/185 



901/301 

gaa ccg ttc gat ctg 
glu pro phe asp leu 
961/321 

gcg ggt etc age gaa 
ala gly leu ser glu 
1021/341 

gac aac gtg tgg gcc 
asp asn val trp ala 
1081/361 

ccc aag get gcc gtg 
pro lys ala ala val 
1141/381 

cat etc ggt tac gac 
his leu gly tyr asp 
1201/401 

ace ggt gat cac cag 
thr gly asp his gin 
1261/421 

gtg acg ctg tac ccg 
val thr leu tyr pro 
1321/441 

tgg ctg ace cgc tgg 
trp leu thr arg trp 



ctt gcc gtg gtc ccc 
leu ala val val pro 

tec ggg tgg ata ccc 
ser gly trp ile pro 

ate ggc gat gcg ace 
ile gly asp ala thr 

ttc gcc gaa gcc cag 
phe ala glu ala gin 

gta get gag cgc cac 
val ala glu arg his 

gca gcc aag ggc gac 
ala ala lys gly asp 

ccg teg egg gag ttt 
pro ser arg glu phe 

aag acg tga 
lys thr OPA 



931/311 

ccg cac gtg ccc tec 
pro his val pro ser 
991/331 

gtg gac ccg cgc ace 
val asp pro arg thr 
1051/351 

gtg ctg acg ctg ccg 
val leu thr leu pro 
1111/371 

gcc gca gtt gtc gcc 
ala ala val val ala 
1171/391 

ttc acc ggc acg ggc 
phe thr gly thr gly 
1231/411 

ggc gat ttc ttc get 
gly asp phe phe ala 
1291/431 

cac gag gag aag gtc 
his glu glu lys val 



gcc 
ala 


gcg 
ala 


gcg 
ala 


egg 
arg 


tea 
ser 


ctg 
leu 


tec 
ser 


act 
thr 


age 
ser 


gcc 
ala 


aat ggc 
asn gly 


aaa 
lys 


ccg 
pro 


ctg 
leu 


cac 
his 


ggc 
gly 


gtc 
val 


gcc 
ala 


cgc 
arg 


gcc 
ala 


tgc 
cys 


tac 
tyr 


gtc 
val 


gag 
glu 


ccg 
pro 


teg 
ser 


gcg 
ala 


ccc 
pro 


teg 
ser 


gca 
ala 


caa 
gin 


gaa 
glu 


ctg 
leu 


gcc 
ala 



SEQ ID N° 48F (suite) 
FIGURE 48F (suite) 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 




PCT/FR9S/01813 



166/185 



Fragment amplifie par PCR d'apres les 
protease de la famille htrA de E. coli 
et du site SnaBI a l'extremite 3*) et a 



1/1 


















cca tct 


aca 


ccg 


etc 


aac 


aac 


egg 


gee 


aaa 


pro ser 


thr 


pro 


leu 


asn 


ser 


arg 


ala 


arg 


61/21 
















tga tec 


gtg gcg 


aot 


tat 


tea 


tat 


cgc 


acre 
y y 


OPA ser 


val 


ala 


ser 


cys 


ser 


cys 


arg 


glv 


121/41 


















tec gtc 


tga 


cca 


acg 


gta 


gtt 


cac 


tac 


taa 


ser val 


OPA pro 


thr 


val 


val 


arg 


cys 


OPA 


181/61 
















tea tga 


aca 


age 


tgc 


gtt 


ggg 


tgc 


tat 


tga 


ser OPA 


thr 


ser 


cys 


val 


gly 


cys 


tyr 


OPA 


241/81 


















cog tgg 


ccg 


ggg 


qqa 


too 


tea 


cec 


aaa 


ccg 


arg trp 


pro gly 


gly 


trp 


ser 


pro 


alv 


pro 


301/101 














egg ccg 


age 


ggg 


too 

W 3 3 


cac 


aaa 


cca 


acg 


acc 


arg pro 


ser 


gly 


trp 


arg 


glu 


pro 


thr 


thr 


361/121 


















aat tgg 


cca 


ggc 


tqa 


caa 


aaa 


cat 


tea 


att 


asn trp 


pro gly 


OPA 


gin 


arg 


his 


ser 


ile 


421/141 














aac ggc 


agg 


caa 


ggc 


tgg 


tta 


ccg 


acg 


cca 


asn gly 


arg gin 


gly 


trp 


leu 


pro 


thr 


pro 


481/161 
















tgc gca 


cca 


atg 


teg 


aac 


tct 


tqa 


tqg 


cct 


cys ala 


pro 


met 


ser 


asn 


ser 


OPA 


trp 


pro 


541/181 














age agg 


aga *tgg 


teg 


acc 


tgc 


gtg 


ccg 


atg 


ser arg 


arg 


trp 


ser 


thr 


cys 


val 


pro 


met 


601/201 
















tgg tag 


gcg 


att 


tgg 


tgg 


acc 


tgt 


cec 


gag 


trp AMB 


ala 


ile 


trp 


trp 


thr 


cys 


pro 


glu 


661/221 












teg aca 


tgg 


ctg 


acg 


teg 


teg 


acc 


gca 


gec 


ser thr 


trp 


leu 


thr 


ser 


ser 


thr 


ala 


ala 


721/241 


















tec ttt 


teg 


acg 


teg 


agg 


tga 


ttg 


ggt 


ggc 


ser phe 


ser 


thr 


ser 


arg 


OPA 


leu 


giy 


gly 


781/261 
















gga tgg 


cgc 


tta 


acc 


tga 


tgg 


aca 


acg 


ccg 


gly trp 


arg 


leu 


thr 


OPA 


trp 


thr 


thr 


pro 


841/281 
















gtg tea 


ggc 


tga 


gee 


age 


teg 


acg 


cgt 


cgc 


val ser 


gly 


OPA 


ala 


ser 


ser 


thr 


arg 


arg 



;imilarites de sequences avec une serine 
(creation du site BaroHI a l'extremite 5 1 
>us-clone dans le vecteur pJVED: 



31/11 


















cgc tgc 
arg cys 
91/31 


con 
arg 


tea 
ser 


val 


ctg 
leu 


ccg 
pro 


aga 
arg 


agg 
arg 


egg 
arg 


nca cca 

ala pro 
151/51 


ccg 
pro 


ccg 
pro 


acc 
thr 


aac 
asn 


ggg 

gly 


tgc 
cys 


ttg 
leu 


cca 
pro 


tct cca 
ser pro 
211/71 


aaa 
lys 


gtc 
val 


tea 
ser 


age 
ser 


cca 
pro 


ccg 
pro 


aag 
lys 


cag 
gin 


tcq taa 
ser trp 
271/91 


ata 
val 


aaa 
gly 


teg 
ser 


gly 


tgg 
trp 


egg 
arg 


teg 
ser 


ccg 
pro 


aac taa 
giy OPA 
331/111 


aac 
gly 


caa 
arg 


trp 


y <— 

ala 


ncc 

ala 


t-Ld 

ser 


ccg 
pro 


aag 
lys 


tac acre 
cys gly 
391/131 


cca 
pro 


tec 
ser 


CCrt 

ccg 
pro 


t- cf- 

ser 


ccg 

ser 


gca 
ala 


gcg 
ala 


acg 
thr 


taa tgc 
OCH cys 
451/151 


tcre 
cys 


rr net 

gly 


arg 


tgg 
trp 


ccg 
pro 


agc 
ser 


cac 
his 


ggg 

gly 


gac atg 
asp met 
511/171 


aat 
asn 


tqc 
cys 


gta 
val 


cec 
pro 


cgc 
arg 


taa 
OCH 


cgt 
arg 


arg 


cga tgq 
arg trp 
571/191 


cec 
pro 


caa 
u yy 

arg 


aaa 
gly 


etc 
leu 


cgc 
arg 


cm c 

ggc 
gly 


tyr 


cca 
pro 


tgc tgg 
cys trp 
631/211 


etc 
leu 


aaa 
lys 


teg 
ser 


agg 
arg 


aat 
asn 


tgt 
cys 


cca 
pro 


cac 
his 


gcg acg 
ala thr 
691/231 


ccg 
pro 


gag 
glu 


aag 

lys 


tgg 
trp 


tgc 
cys 


acg 
thr 


age 
ser 


egg 
arg 


tgg age 
trp ser 
751/251 


ggg 

gly 


tea 
ser 


ggc 
gly 


ggc 
gly 


ggc 
gly 


gca 
ala 


acg 
thr 


ata 
ile 


agg ttt 
arg phe 
811/271 


atg 
met 


gcg 
ala 


ata 
ile 


ccg 
pro 


ctg 
leu 


gat 
asp 


tgt 
cys 


cgc 
arg 


cga agt 
arg ser 
871/291 


gga 
gly 


gec 
ala 


cgc 
arg 


egg 
arg 


gcg 
ala 


gec 
ala 


acg 
thr 


tgg 
trp 


acg ctg 
thr leu 


age 
ser 


tgg 
trp 


tgg 
trp 


ttt 
phe 


ccg 
pro 


acc 
thr 


gcg 
ala 


gec 
ala 



SEQ ID N° 49A 



FIGURE 4 9A 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 




PCT/FR98/01813 



167/185 



901/301 






egg gca ttc 


ccg 


tgc 


arg ala phe 


pro 


cys 


961/321 






cac ggg cgt 


tgc 


egg 


his gly arg 


cys 


arg 


1021/341 






acg gcg gat 


tgc 


tgc 


thr ala asp 


cys 


cys 


1081/361 






ttt acg tgc 


tgc 


tec 


phe thr cys 


cys 


ser 


1141/381 






gcg etc gga 


gca 


egg 


ala leu gly 


ala 


arg 


1201/401 






etc agt cca 


cgc 


gcg 


leu ser pro 


arg 


ala 


1261/421 






cca cgc atg 


gee 


aag 


pro arg met 


ala 


lys 


1321/441 






atg acg aat 


cac 


cca 


met thr asn 


his 


pro 


1381/461 




cag ggg cag 


cag 


caa 


gin gly gin 


gin 


gin 


1441/481 






ccg cag cca 


acc 


cag 


pro gin pro 


thr 


gin 


1501/501 






ata cct ggc 


gtg 


att 


ile pro gly 


val 


ile 


1561/521 






gca ggc atg 


ttg 


gee 


ala gly met 


leu 


ala 


1621/541 






gcg gee gca 


tec 


ctg 


ala ala ala 


ser 


leu 


1681/561 






get gee age 


gcg 


gcg 


ala ala ser 


ala 


ala 


1741/581 






gtg gcg gee 


aag 


gtg 


val ala ala 


lys 


val 


1801/601 




gag gag ggc 


tec 


ggc 


glu glu gly 


ser 


gly 


1861/621 






ate gcg gcg 


gee 


gec 


ile ala ala 


ala 


ala 



agg age gee gtc tgg 
arg ser ala val trp 

gtt egg gee teg ggt 
val arg ala ser gly 

gca teg aag aca ccg 
ala ser lys thr pro 

ccg gee gtc gga tgc 
pro ala val gly cys 

aca teg aga act etc 
thr ser arg thr leu 

caa cct agt tgt gca 
gin pro ser cys ala 

ttg gee cga gta gtg 
leu ala arg val val 

egg tat teg cca ccg 
arg tyr ser pro pro 

acg tac age cag cag 
thr tyr ser gin gin 

tac cgt caa ccc tac 
tyr arg gin pro tyr 

ccg acc atg acg ccc 
pro thr met thr pro 

ate ggc gcg gtg acg 
ile gly ala val thr 

gtc ggg ttc aac egg 
val gly phe asn arg 

cca age ate ccc gca 
pro ser ile pro ala 

gtg ccc agt gtc gtc 
val pro ser val val 

ate att ctg tct gee 
ile ile leu ser ala 

aag cct ccc ctg ggc 
lys pro pro leu gly 



931/311 

tgt ttg aac ggt ttt 
cys leu asn gly phe 
991/331 

tgg cga teg tea aac 
trp arg ser ser asn 
1051/351 

acc cag gcg gec age 
thr gin ala ala ser 
1111/371 

cga ttc cgc age ttc 
arg phe arg ser phe 
1171/391 

ggg gtt egg cga acg 
gly val arg arg thr 
1231/411 

gtt act gtt gaa age 
val thr val glu ser 
1291/431 

ggc eta gta cag gaa 
gly leu val gin glu 
1351/451 

ccg cag cag ccg gga 
pro gin gin pro gly 
1411/471 

ttc gac tgg cgt tac 
phe asp trp arg tyr 
1471/491 

gag gcg ttg ggt ggt 
glu ala leu gly gly 
1531/511 

cct cct ggg atg gtt 
pro pro gly met val 
1591/531 

ata gcg gtg gtg tec 
ile ala val val ser 
1651/551 

gca ccc gee ggc ccc 
ala pro ala gly pro 
1711/571 

gca aac atg ccg ccg 
ala asn met pro pro 
1771/591 

atg ttg gaa acc gat 
met leu glu thr asp 
1831/611 

gag ggg ctg ate ttg 
glu gly leu ile leu 
1891/631 

agt ccg ccg ccg aaa 
ser pro pro pro lys 



acc 
thr 


ggt 
gly 


egg 
arg 


cat 
his 


egg 
arg 


agg 
arg 


tgg 
trp 


tgc 
cys 


tea 
ser 


acc 
thr 


ccc 
pro 


ctg 
leu 


gaa 
glu 


cgt 
arg 


cga 
arg 


ccg 
pro 


gtg 
val 


cga 
arg 


egg 
arg 


ctg 
leu 


tta 
leu 


tct 
ser 


cag 
gin 


tgg 
trp 


aat 
asn 


cac 
his 


acc 
thr 


cat 
his 


gee 
ala 


agt 
ser 


gag 
glu 


caa 
gin 


cct 
pro 


age 
ser 


gac 
asp 


acc 
thr 


cca 
pro 


ggt 
gly 


tat 
tyr 


get 
ala 


cca 
pro 


ccg 
pro 


tec 
ser 


ccg 
pro 


ccc 
pro 


acc 
thr 


egg 
arg 


ccg 
pro 


ggt 
gly 


ctg 
leu 


cgc 
arg 


caa 
gin 


cgc 
arg 


cct 
pro 


cgt 
arg 


gee 
ala 


ggc 


ate 


ggc 
gly 


ggc 

giy 


age 

ser 


ggc 
gly 


ggc 
gly 


cca 
pro 


gtg 
val 


ggg 

gly 


teg 
ser 


gtc 
val 


gaa 
glu 


cag 
gin 


ctg 
leu 


ggc 
gly 


cgc 
arg 


cag 
gin 


teg 
ser 


acc 
thr 


aac 
asn 


aac 
asn 


cac 
his 


gtg 
val 


acg 
thr 


acg 
thr 


gta 
val 







SEQ ID N° 49A (suite 1) 
FIGURE 49A (suite 1) 
FEUILLE DE REMPLACEMENT (REGLE 26) 




WO 99/09186 ^FPCT/FR98/01813 



168/185 



1/1 








cat eta 


cac 


cgc 


tea 


his leu 


his 


arg 


ser 


61/21 






gat ccg 


tgg 


cga 


gtt 


asp pro 


trp 


arg 


val 


121/41 








ccg tct 


gac 


caa 


egg 


pro ser 


asp 


gin 


arg 


181/61 








cat gaa 


caa 


get 


gcg 


his glu 


gin 


ala 


ala 


241/81 








ggt ggc 


egg 


ggg 


gat 


gly gly 


arg 


gly 


asp 


301/101 








ggc cga 


gcg 


ggt 


ggc 


gly arg 


ala 


gly 


giy 


361/121 








att ggc 


cag 


get 


gac 


ile gly 


gin 


ala 


asp 


421/141 








acg gca 


ggc 


aag 


get 


thr ala 


gly 


lys 


ala 


481/161 








gcg cac 


caa 


tgt 


cga 


ala his 


gin 


cys 


arg 


541/181 








gca gga 


gat 


ggt 


cga 


ala gly 


asp 


gly 


arg 


601/201 








ggt agg 


cga 


ttt 


ggt 


gly arg 


arg phe 


gly 


661/221 








cga cat 


ggc 


tga 


cgt 


arg his 


gly 


OPA 


arg 


721/241 








cct ttt 


cga 


cgt 


cga 


pro phe 


arg 


arg 


arg 


781/261 








gat ggc 


get 


taa 


cct 


asp gly 


ala 


OCH 


pro 


841/281 








tgt cag 


get 


gag 


cca 


cys gin 


ala 


glu 


pro 


901/301 








ggg cat 


tec 


cgt 


gca 


gly his 


ser 


arg 


ala 


961/321 






acg ggc 


gtt 


gee 


ggg 


thr gly 


val 


ala 


gly 


1021/341 






egg egg 


att 


get 


gcg 


arg arg 


ile 


ala 


ala 



aca gee ggg cca gac 
thr ala gly pro asp 

gtt cat gtc gcg gcg 
val his val ala ala 

tag ttc get get gat 
AMB phe ala ala asp 

ttg ggt get att gat 
leu gly ala ile asp 

ggt cac ccg ggc egg 
gly his pro gly arg 

gcg aac cga cga cct 
ala asn arg arg pro 

aga ggc att caa ttt 
arg gly ile gin phe 

ggt tac cga cgc egg 
gly tyr arg arg arg 

act ctt gat ggc etc 
thr leu asp gly leu 

cct gcg tgc cga tgt 
pro ala cys arg cys 

gga cct gtc ccg agg 
gly pro val pro arg 

cgt cga ccg cag cct 
arg arg pro gin pro 

ggt gat tgg gtg gca 
gly asp trp val ala 

gat gga caa cgc cgc 
asp gly gin arg arg 

get cga cgc gtc gca 
ala arg arg val ala 

gga gcg ccg tct ggt 
gly ala pro ser gly 

ttc ggg cct egg gtt 
phe gly pro arg val 

cat cga aga cac cga 
his arg arg his arg 



31/11 

get gee ggt egg tgc 
ala ala gly arg cys 
91/31 

cac cac cgc cga cca 
his his arg arg pro 
151/51 

etc caa aag tct caa 
leu gin lys ser gin 
211/71 

cgt ggg tgg gat egg 
arg gly trp asp arg 
271/91 

get gag gec ggt ggg 
ala glu ala gly gly 
331/111 

gcg gee cat ccc cgt 
ala ala his pro arg 
391/131 

aat get gcg ggc get 
asn ala ala gly ala 
451/151 

aca tga att gcg tac 
thr OPA ile ala tyr 
511/171 

gat ggc ccc ggg ggc 
asp gly pro gly gly 
571/191 

get ggc tea aat cga 
ala gly ser asn arg 
631/211 

cga cgc egg aga agt 
arg arg arg arg ser 
691/231 

gga gcg ggt cag gcg 
gly ala gly gin ala 
751/251 

ggt tta tgg cga tac 
gly leu trp arg tyr 
811/271 

gaa gtg gag ccc gec 
glu val glu pro ala 
871/291 

cgc tga get ggt ggt 
arg OPA ala gly gly 
931/311 

gtt tga acg gtt tta 
val OPA thr val leu 
991/331 

ggc gat cgt caa aca 
gly asp arg gin thr 
1051/351 

ccc agg egg cca gee 
pro arg arg pro ala 



tgc 
cys 


cga 
arg 


gaa 
glu 


ggc 
gly 


ggt 
gly 


acg 
thr 


ggt 

giy 


get 
ala 


tgc 
cys 


cat 
his 


gee 
ala 


cac 
his 


cga 
arg 


age 
ser 


agt 
ser 


ggt 
gly 


ggc 
gly 


ggt 
gly 


cgc 
arg 


cgc 
arg 


ccg 
pro 


cct 
pro 


cac 
his 


cga 
arg 


age 
ser 


ctt 
leu 


egg 
arg 


cag 
gin 


cga 
arg 


cga 
arg 


ggc 

gly 


cga 
arg 


gtc 
val 


acg 
thr 


gga 
gly 


ccc 
pro 


get 
ala 


aac 
asn 


gtc 
val 


get 
ala 


tec 
ser 


gcg 
ala 


get 
ala 


ace 
thr 


caa 
gin 


gga 
gly 


att 
ile 


gtc 
val 


cac 
his 


act 
thr 


ggt 

giy 


gca 
ala 


cga 
arg 


gec 
ala 


ggt 
gly 


gcg 
ala 


gcg 
ala 


caa 
gin 


cga 
arg 


tat 
tyr 


cgc 
arg 


tgg 
trp 


att 
ile 


gtc 
val 


gcg 
ala 


ggg 

gly 


egg 
arg 


cca 
pro 


cgt 
arg 


ggg 

gly 


ttc 
phe 


cga 
arg 


ccg 
pro 


egg 
arg 


ccc 
pro 


ccg 
pro 


gtc 
val 


ggc 
gly 


ate 
ile 


ggc 
gly 


ggt 
gly 


ggt 
gly 


get 
ala 


caa 
gin 


cca 
pro 


ccc 
pro 


tgg 
trp 


aac 
asn 


gtc 
val 


gat 
asp 



SEQ ID N° 49B 
FEUILLE DE REMPU&eMEtfPfREGLE 26) 



WO 99/09186 




PCT/FR98/01813 



169/185 



1081/361 






tta cgt get 


get 


ccc 


leu arg ala 


ala 


pro 


1141/381 






cgc teg gag 


cac 


gga 


arg ser glu 


his 


gly 


1201/401 






tea gtc cac 


gcg 


cgc 


ser val his 


ala 


arg 


1261/421 




cac gca tgg 


cca 


agt 


his ala trp 


pro 


ser 


1321/441 






tga cga ate 


acc 


cac 


OPA arg ile 


thr 


his 


1381/461 






agg ggc age 


age 


aaa 


arg gly ser 


ser 


lys 


'1441/481 






cgc age caa 


ccc 


agt 


arg ser gin 


pro 


ser 


1501/501 






tac ctg gcg 


tga 


ttc 


tyr leu ala 


OPA phe 


.1561/521 






cag gca tgt 


tgg 


cca 


gin ala cys 


trp 


pro 


1621/541 






egg ccg cat 


ccc 


tgg 


arg pro his 


pro 


trp 


1681/561 






ctg cca gcg 


egg 


cgc 


leu pro ala 


arg 


arg 


1741/581 






tgg egg cca 


agg 


tgg 


trp arg pro 


arg 


trp 


1801/601 






agg agg get 


ccg 


gca 


arg arg ala 


pro 


ala 


1861/621 






teg egg egg 


ccg 


cca 


ser arg arg 


pro 


pro 



egg ccg teg gat gec 
arg pro ser asp ala 

cat cga gaa etc teg 
his arg glu leu ser 

aac eta gtt gtg cag 
asn leu val val gin 

tgg ccc gag tag tgg 
trp pro glu AMB trp 

ggt att cgc cac cgc 
gly ile arg his arg 

cgt aca gec age agt 
arg thr ala ser ser 

acc gtc aac cct acg 
thr val asn pro thr 

cga cca tga cgc ccc 
arg pro OPA arg pro 

teg gcg egg tga cga 
ser ala arg OPA arg 

teg ggt tea acc ggg 
ser gly ser thr gly 

caa gca tec ccg cag 
gin ala ser pro gin 

tgc cca gtg teg tea 
cys pro val ser ser 

tea ttc tgt ctg ccg 
ser phe cys leu pro 

age etc ccc tgg gca 
ser leu pro trp ala 



1111/371 

gat tec gca get tec 
asp ser ala ala ser 
1171/391 

ggg ttc ggc gaa cgt 
gly phe gly glu arg 
1231/411 

tta ctg ttg aaa gee 
leu leu leu lys ala 
1291/431 

gee tag tac agg aag 
ala AMB tyr arg lys 
1351/451 

cgc age age egg gaa 
arg ser ser arg glu 
1411/471 

teg act ggc gtt acc 
ser thr gly val thr 
1471/491 

agg cgt tgg gtg gta 
arg arg trp val val 
1531/511 

etc ctg gga tgg ttc 
leu leu gly trp phe 
1591/531 

tag egg tgg tgt ccg 
AMB arg trp cys pro 
1651/551 

cac ccg ccg gee cca 
his pro pro ala pro 
1711/571 

caa aca tgc cgc egg 
gin thr cys arg arg 
1771/591 

tgt tgg aaa ccg ate 
cys trp lys pro ile 
1831/611 

agg ggc tga tct tga 
arg gly OPA ser OPA 
1891/631 

gtc cgc cgc cga aaa 
val arg arg arg lys 



egg 
arg 


tgc 
cys 


gac 
asp 


ggc 
gly 


tgg 
trp 


tat 
tyr 


etc 
leu 


agt 
ser 


gga 
gly 


ate 
ile 


aca 
thr 


ccc 
pro 


atg 
met 


cca 
pro 


gtc 
val 


age 
ser 


aac 
asn 


eta 
leu 


gcg 
ala 


aca 
thr 


ccc 
pro 


cag 
gin 


gtt 
val 


atg 
met 


etc 
leu 


cac 
his 


cgt 
arg 


ccc 
pro 


cgc 
arg 


ccc 
pro 


ccc 
pro 


ggc 
gly 


egg 
arg 


gtc 
val 


tga 
OPA 


gec 
ala 


aac 
asn 


gee 
ala 


etc 
leu 


gtg 
val 


ccg 
pro 


gca 
ala 


teg 
ser 


gcg 
ala 


gcg 
ala 


gcg 
ala 


gcg 
ala 


gee 
ala 


cag 
gin 


tgg 
trp 


ggt 
gly 


egg 
arg 


teg 
ser 


aac 
asn 


agg 
arg 


tgg 
trp 


gec 
ala 


gec 
ala 


agt 
ser 


egg 
arg 


cca 
pro 


aca 
thr 


acc 
thr 


acg 
thr 


tga 
OPA 


cga 
arg 


egg 
arg 


ta 







SEQ ID N° 49B (suite 1) 
FIGURE 49B (suite 1) 



FEUILLE DE REM PLACEM ENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



170/185 



1/1 








ate tac 


acc 


get 


caa 


ile tyr 


thr 


ala 


gin 


61/21 








ate cgt 


gg c 


gag 


ttg 


ile arg 


gly 


glu 


leu 


121/41 








cgt ctg 


acc 


aac 


ggt 


arg leu 


thr 


asn 


gly 


181/61 








atg aac 


aag 


ctg 


cgt 


met asn 


lys 


leu 


arg 


241/81 








gtg gec 


ggg 


ggg 


atg 


val ala 


gly 


gly 


met 


301/101 








gee gag 


egg 


gtg 


gcg 


ala glu 


arg 


val 


ala 


361/121 








ttg gee 


agg 


ctg 


aca 


leu ala 


arg 


leu 


thr 


421/141 








egg cag 


gca 


agg 


ctg 


arg gin 


ala 


arg 


leu 


481/161 








cgc acc 


aat 


gtc 


gaa 


arg thr 


asn 


val 


glu 


541/181 








cag gag 


atg 


gtc 


gac 


gin glu 


met 


val 


asp 


601/201 








gta ggc 


gat 


ttg 


gtg 


val gly 


asp 


leu 


val 


661/221 








gac atg 


get 


gac 


gtc 


asp met 


ala 


asp 


val 


721/241 








ctt ttc 


gac 


gtc 


gag 


leu phe 


asp 


val 


glu 


781/261 








atg gcg 


ctt 


aac 


ctg 


met ala 


leu 


asn 


leu 


841/281 








gtc agg 


ctg 


age 


cag 


val arg 


leu 


ser 


gin 


901/301 








ggc att 


ccc 


gtg 


cag 


gly ile 


pro 


val 


gin 


961/321 








egg gcg 


ttg 


ccg 


ggt 


arg ala 


leu 


pro 


gly 



cag 
gin 


ccg 
pro 


ggc 
gly 


cag 
gin 


acg 
thr 


ttc 
phe 


atg 
met 


teg 
ser 


egg 
arg 


cgc 
arg 


agt 
ser 


teg 
ser 


ctg 
leu 


ctg 
leu 


ate 
ile 


tgg 
trp 


gtg 
val 


eta 
leu 


ttg 
leu 


ate 
ile 


gtc 
val 


acc 
thr 


egg 
arg 


gee 
ala 


ggg 

gly 


cga 
arg 


acc 
thr 


gac 
asp 


gac 
asp 


ctg 
leu 


gag 
glu 


gca 
ala 


ttc 
phe 


aat 
asn 


tta 
leu 


gtt 
val 


acc 
thr 


gac 
asp 


gec 
ala 


gga 
gly 


etc 
leu 


ttg 
leu 


atg 
met 


gee 
ala 


teg 
ser 


ctg 
leu 


cgt 
arg 


gec 
ala 


gat 
asp 


gtg 
val 


gac 
asp 


ctg 
leu 


tec 
ser 


cga 
arg 


ggc 
gly 


gtc 
val 


gac 
asp 


cgc 
arg 


age 
ser 


ctg 
leu 


gtg 
val 


att 
ile 


ggg 

gly 


tgg 
trp 


cag 
gin 


atg 

met 


gac 
asp 


aac 
asn 


gec 
ala 


gcg 
ala 


etc 
leu 


gac 
asp 


gcg 
ala 


teg 
ser 


cac 
his 


gag 
glu 


cgc 
arg 


cgt 
arg 


ctg 
leu 


gtg 
val 


teg 
ser 


ggc 

gly 


etc 
leu 


ggg 

gly 


ttg 
leu 



31/11 

ctg ccg gtc ggt get 
leu pro val gly ala 
91/31 

acc acc gee gac caa 
thr thr ala asp gin 
151/51 

tec aaa agt etc aag 
ser lys ser leu lys 
211/71 

gtg ggt ggg ate ggg 
val gly gly ile gly 
271/91 

ctg agg ccg gtg ggc 
leu arg pro val gly 
331/111 

egg ccc ate ccc gtc 
arg pro ile pro val 
391/131 

atg ctg egg gcg ctg 
met leu arg ala leu 
451/151 

cat gaa ttg cgt acc 
his glu leu arg thr 
511/171 

atg gec ccg ggg get 
met ala pro gly ala 
571/191 

ctg get caa ate gag 
leu ala gin ile glu 
631/211 

gac gec gga gaa gtg 
asp ala gly glu val 
691/231 

gag egg gtc agg egg 
glu arg val arg arg 
751/251 

gtt tat ggc gat acc 
val tyr gly asp thr 
811/271 

aag tgg age ccg ccg 
lys trp ser pro pro 
871/291 

get gag ctg gtg gtt 
ala glu leu val val 
931/311 

ttt gaa egg ttt tac 
phe glu arg phe tyr 
991/331 

gcg ate gtc aaa cag 
ala ile val lys gin 



gec 
ala 


gag 
glu 


aag 
lys 


gcg gtg 
ala val 


egg 
arg 


gtg 
val 


ctt 
leu 


gec ate 
ala ile 


ccc 
pro 


acc 
thr 


gaa 
glu 


gca gtc 
ala val 


gtg 
val 


gcg 
ala 


gtc 
val 


gec gcg 
ala ala 


cgc 
arg 


etc 
leu 


acc 
thr 


gaa gcg 
glu ala 


ttc 
phe 


ggc 

gly 


age 
ser 


gac gaa 
asp glu 


gee 
ala 


gag 
glu 


tea 
ser 


egg gaa 
arg glu 


ccg 
pro 


eta 
leu 


acg 
thr 


teg ctg 
ser leu 


ccg 
pro 


egg 
arg 


eta 

leu 


ccc aag 
pro lys 


gaa 
glu 


ttg 
leu 


tec 
ser 


aca ctg 
thr leu 


gtg 
val 


cac 
his 


gag 
glu 


ccg gtc 
pro val 


egg 

arg 


cgc 

A rr% 


aac 
asn 


gat ate 
asp ile 


get 
ala 


gga 
gly 


ttg 
leu 


teg egg 
ser arg 


ggc 
gly 


ggc 
gly 


cac 
his 


gtg ggt 
val gly 


tec 
ser 


gac 
asp 


cgc 
arg 


ggc ccg 
gly pro 


egg 
arg 


teg 
ser 


gca 
ala 


teg gca 
ser ala 


gtg 
val 


gtg 
val 


etc 
leu 


aac cac 
asn his 



SEQ ID N° 4 9C 



FIGURE 49C 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



7FR98/01813 



171/185 



1021/341 

ggc gga ttg ctg cgc 
gly gly leu leu arg 
1081/361 

tac gtg ctg etc ccc 
tyr val leu leu pro 
1141/381 

get egg age acg gac 
ala arg ser thr asp 
1201/401 

cag tec acg cgc gca 
gin ser thr arg ala 
1261/421 

acg cat ggc caa gtt 
thr his gly gin val 
1321/441 

gac gaa tea ccc acg 
asp glu ser pro thr 
1381/461 

ggg gca gca gca aac 
gly ala ala ala asn 
1441/481 

gca gec aac cca gta 
ala ala asn pro val 
1501/501 

acc tgg cgt gat tec 
thr trp arg asp ser 
1561/521 

agg cat gtt ggc cat 
arg his val gly his 
1621/541 

ggc cgc ate cct ggt 
gly arg ile pro gly 
1681/561 

tgc cag cgc ggc gee 
cys gin arg gly ala 
1741/581 

ggc ggc caa ggt ggt 
gly gly gin gly gly 
1801/601 

gga ggg etc egg cat 
gly gly leu arg his 
1861/621 

cgc ggc ggc cgc caa 
arg gly gly arg gin 



ate gaa gac acc gac 
ile glu asp thr asp 

ggc cgt egg atg ccg 
gly arg arg met pro 

ate gag aac tct egg 
ile glu asn ser arg 

acc tag ttg tgc agt 
thr AMB leu cys ser 

ggc ccg agt agt ggg 
gly pro ser ser gly 

gta ttc gee acc gec 
val phe ala thr ala 

gta cag cca gca gtt 
val gin pro ala val 

ccg tea acc eta cga 
pro ser thr leu arg 

gac cat gac gec ccc 
asp his asp ala pro 

egg cgc ggt gac gat 
arg arg gly asp asp 

egg gtt caa ccg ggc 
arg val gin pro gly 

aag cat ccc cgc age 
lys his pro arg ser 

gec cag tgt cgt cat 
ala gin cys arg his 

cat tct gtc tgc cga 
his ser val cys arg 

gec tec cct ggg cag 
ala ser pro gly gin 



1051/351 

cca ggc ggc cag ccc 
pro gly gly gin pro 
1111/371 

att ccg cag ctt ccc 
ile pro gin leu pro 
1171/391 

ggt teg gcg aac gtt 
gly ser ala asn val 
1231/411 

tac tgt tga aag cca 
tyr cys OPA lys pro 
1291/431 

cct agt aca gga aga 
pro ser thr gly arg 
1351/451 

gca gca gee ggg aac 
ala ala ala gly asn 
1411/471 

cga ctg gcg tta ccc 
arg leu ala leu pro 
1471/491 

ggc gtt ggg tgg tac 
gly val gly trp tyr 
1531/511 

tec tgg gat ggt teg 
ser trp asp gly ser 
1591/531 

age ggt ggt gtc cgc 
ser gly gly val arg 
1651/551 

acc cgc egg ccc cag 
thr arg arg pro gin 
1711/571 

aaa cat gee gec ggg 
lys his ala ala gly 
1771/591 

gtt gga aac cga tct 
val gly asn arg ser 
1831/611 

ggg get gat ctt gac 
gly ala asp leu asp 
1891/631 

tec gec gec gaa aac 
ser ala ala glu asn 



cct 
pro 


gga 
gly 


acg 
thr 


teg 
ser 


att 
ile 


ggt 
gly 


gcg 
ala 


acg 
thr 


get 
ala 


ggc 
gly 


ate 
ile 


tea 
ser 


gtg 
val 


gaa 
glu 


tct 
ser 


cac 
his 


cca 
pro 


tgc 
cys 


cag 
gin 


tec 
ser 


gca 
ala 


acc 
thr 


tag 
AMB 


cga 
arg 


cat 
his 


ccc 
pro 


agg 
arg 


tta 
leu 


tgc 
cys 


tea 
ser 


acc 
thr 


gtc 
val 


ccc 
pro 


gec 
ala 


ccc 
pro 


ccg 
pro 


gec 
ala 


ggg 

gly 


tct 
ser 


gat 
asp 


cca 
pro 


acg 
thr 


ccc 
pro 


teg 
ser 


tgc 
cys 


egg 
arg 


cat 
his 


egg 
arg 


egg 
arg 


cgc 
arg 


egg 
arg 


egg 
arg 


ccc 
pro 


agt 
ser 


ggc 
gly 


gtc 
val 


ggt 
gly 


cga 
arg 


aca 
thr 


ggt 
gly 


ggg 

gly 


ccg 
pro 


cca 
pro 


gtc 
val 


gga 
gly 


caa 
gin 


caa 
gin 


cca 
pro 


cgt 
arg 


gat 
asp 


gac 
asp 


ggt 
gly 


a 







SEQ ID N° 49C (suite 1) 
FIGURE 49C (suite 1) 

FEUILLE OE REMPLACEMENT (REGLE 26) 



WO 99/09186 




PCT/FR98/01813 



172/185 



Sequence codante Rv0983 predite par Cole et al., 1998 (Nature 393:537-544) et 
contenant seq60A: 



1/1 


















31/11 














atg gcc 
Met ala 
61/21 


aag 

lys 


ttg 
leu 


gcc 
ala 


cga 
arg 


gta 
val 


gtg ggc 
val gly 


eta 
leu 


gta cag 
val gin 
91/31 


gaa gag caa 
glu glu gin 


cet 
pro 


age 
ser 


gac 
asp 


atg 
met 


acg 
thr 


aat cac 
asn his 
121/41 


cca 
pro 


egg 
arg 


tat 
tyr 


teg 
ser 


cca 
pro 


ccg 
pro 


ccg 
pro 


cag 
gin 


cag ccg 
gin pro 
151/51 


gga acc cca 
gly thr pro 


aat 
gly 


tat 
tyr 


get 
ala 


cag 
gin 


ggg 
gly 


cag cag 
gin gin 
181/61 


caa 
gin 


acg 
thr 


tac 
tyr 


age 
ser 


cag 
gin 


cag ttc 
gin phe 


gac 
asp 


tag cgt 
trp arg 
211/71 


tac cca ccg 
tyr pro pro 


tec 
ser 


ccg 
pro 


ccc 
pro 


ccg 
pro 


cag 
gin 


cca acc 
pro thr 
241/81 


cag 
gin 


tac 
tyr 


cgt 
arg 


caa 
gin 


ccc 
pro 


tac gag 
tyr glu 


gcg 
ala 


ttg ggt 
leu gly 
271/91 


get acc caa 
gly thr arg 


ccg 
pro 


gly 


ctg 
leu 


ata 
ile 


cet 
pro 


ggc gtg 
gly val 
301/101 


att 
ile 


ccg 
pro 


acc 
thr 


atg 
met 


acg 
thr 


ccc 
pro 


cet 
pro 


cet 
pro 


ggg ata 
gly met 
331/111 


gtt cgc caa 
val arg gin 


cgc 
arg 


cet 
pro 


arg 


gca 
ala 


ggc 
gly 


atg ttg 
met leu 
361/121 


gcc 
ala 


ate 
ile 


ggc 

gly 


gcg 
ala 


gtg 
val 


acg 
thr 


ata 
ile 


gcg 
ala 


gtg gtg 
val val 
391/131 


tec gcc gac 
ser ala gly 


ate 
ile 


aac 
gly 


aac 
gly 


gcg 
ala 


gcc 
ala 


gca tec 
ala ser 
421/141 


ctg 
leu 


gtc 
val 


ggg 
gly 


ttc 
phe 


aae 
asn 


egg 
arg 


gca 
ala 


ccc 
pro 


ccc gac 
ala gly 
451/151 


ccc aac aac. 
pro ser gly 


fine 

gly 


pro 


gtg 
val 


get 
ala 


gcc 
ala 


age gcg 
ser ala 
481/161 


gcg 
ala 


cca 
pro 


age 
ser 


ate 
ile 


ccc 
pro 


gca 
ala 


gca 
ala 


aac 
asn 


atg ccg 
met pro 
511/171 


ccg aaa tea 
pro gly ser 


gtc 
val 


gaa 
glu 


cag 
gin 


gtg 
val 


gcg 
ala 


gcc aag 
ala lys 
541/181 


gtg 
val 


gtg 

val 


ccc 
pro 


agt 
ser 


gtc 
val 


gtc 
val 


atg 
met 


ttg 
leu 


gaa acc 
glu thr 
571/191 


gat ctg ggc 
asp leu gly 


cgc 
arg 


cag 
gin 


teg 
ser 


gag gag 
glu glu 


ggc tec 
gly ser 
601/201 


ggc 
gly 


*atc 
ile 


att 
ile 


ctg 
leu 


tct 
ser 


gcc gag 
ala glu 


ggg 

gly 


ctg ate 
leu ile 
631/211 


ttg acc aac 
leu thr asn 


aac 
asn 


cac 
his 


gtg 
val 


ate 
ile 


gcg 
ala 


gcg gcc 
ala ala 
661/221 


gcc 
ala 


aag 
lys 


cet 
pro 


ccc 
pro 


ctg 
leu 


ggc agt 
gly ser 


ccg 
pro 


ccg ccg 
pro pro 
691/231 


aaa acg acg 
lys thr thr 


gta 
val 


acc 
thr 


ttc 
phe 


tct 
ser 


gac 
asp 


ggg egg 
gly arg 
721/241 


acc 
thr 


gca 
ala 


ccc 
pro 


ttc 
phe 


acg 
thr 


gtg 
val 


gtg 
val 


ggg 

gly 


get gac 
ala asp 
751/251 


ccc acc agt 
pro thr ser 


gat 
asp 


ate 
ile 


gcc 
ala 


gtc 
val 


gtc 
val 


cgt gtt 
arg val 
781/261 


cag 
gin 


ggc 
gly 


gtc 
val 


tec 
ser 


ggg 

gly 


etc 
leu 


acc 
thr 


ccg 
pro 


ate tec 
ile ser 
811/271 


ctg ggt tec 
leu gly ser 


tec 
ser 


teg 
ser 


gac 
asp 


ctg 
leu 


agg 
arg 


gtc ggt 
val gly 


cag 
gin 


ccg 
pro 


gtg 
val 


ctg 
leu 


gcg 
ala 


ate ggg 
ile gly 


teg 
ser 


ccg etc 
pro leu 


ggt ttg gag 
gly leu glu 


ggc 
gly 


acc 
thr 


gtg 
val 


acc 
thr 


acg 
thr 



SEQ ID N° 4 9D 
FIGURE 49D 



FEU1LLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 




'CT/FR98/01813 



173/185 



841/281 






ggg ate gtc 


age 


get 


gly ile val 


ser 


ala 


901/301 






acc gtg ctg 


gac 


gee 


thr val leu 


asp 


ala 


961/321 






ctg gtg aac 


atg 


aac 


leu val asn 


met 


asn 


1021/341 






gac tea gec 


gat 


gcg 


asp ser ala 


asp 


ala 


1081/361 






gec aag cgc 


ate 


gee 


ala lys arg 


ile 


ala 


1141/381 






gtg cag gtg 


acc 


aat 


val gin val 


thr 


asn 


1201/401 






ggt get gee 


gcg 


aac 


gly ala ala 


ala 


asn 


1261/421 






ccg ate aac 


age 


gcg 


pro ile asn 


ser 


ala 


1321/441 






gtg gcg eta 


acc 


ttt 


val ala leu 


thr 


phe 


1381/461 




aag gcg gag 


cag 


tga 


lys ala glu 


gin 


OPA 



etc aac cgt cca gtg 
leu asn arg pro val 

att cag acc gac gee 
ile gin thr asp ala 

get caa etc gtc gga 
ala gin leu val gly 

cag age ggc teg ate 
gin ser gly ser ile 

gac gag ttg ate age 
asp glu leu ile ser 

gac aaa gac acc ctg 
asp lys asp thr leu 

get gga gtg ccg aag 
ala gly val pro lys 

gac gcg ttg gtt gee 
asp ala leu val ala 

cag gat ccc teg ggc 
gin asp pro ser gly 



871/291 

teg acg acc ggc gag 
ser thr thr gly glu 
931/311 

gcg ate aac ccc ggt 
ala ile asn pro gly 
991/331 

gtc aac teg gee att 
val asn ser ala ile 
1051/351 

ggt etc ggt ttt gcg 
gly leu gly phe ala 
1111/371 

acc ggc aag gcg tea 
thr gly lys ala ser 
1171/391 

ggc gec aag ate gtc 
gly ala Ivs ile val 
1231/411 

ggc gtc gtt gtc acc 
gly val val val thr 
1291/431 

gec gtg egg tec aaa 
ala val arg ser lys 
1351/451 

ggt age cgc aca gtg 
gly ser arg thr val 



gee ggc aac cag aac 
ala gly asn gin asn 

aac tec ggg ggc gcg 
asn ser gly gly ala 

gec acg ctg ggc gcg 
ala thr leu gly ala 

att cca gtc gac cag 
ile pro val asp gin 

cat gec tec ctg ggt 
his ala ser leu gly 

gaa gta gtg gee ggt 
glu val val ala gly 

aag gtc gac gac cgc 
lys val asp asp arg 

gcg ccg ggc gee acg 
ala pro gly ala thr 

caa gtc acc etc ggc 
gin val thr leu gly 



SEQ ID N° 49D (suite 1) 
FIGURE 49D (suite 1) 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



174/185 



ORF d'apres 



Cole et 



al., 1998 (Nature 393:537-544) et contenant 



Rv0983 



1/1 



31/11 



tga gcc age teg acg cgt cgc acg ctg age tgg tgg ttt ccg acc gcg gec egg gca ttc 
OPA ala ser ser thr arg arg thr leu ser trp trp phe pro thr ala ala arg ala phe 
61/21 91/31 

ccg tgc agg age gcc gtc tgg tgt ttg aac ggt ttt acc ggt egg cat egg cac ggg cgt 
pro cys arg ser ala val trp cys leu asn gly phe thr gly arg his arg his gly arg 
121/41 151/51 

tgc egg gtt egg gcc teg ggt tgg cga teg tea aac agg tgg tgc tea acc acg gcg gat 
cys arg val arg ala ser gly trp arg ser ser asn arg trp cys ser thr thr ala asp 
181/61 211/71 

tgc tgc gca teg aag aca ccg acc cag gcg gcc age ccc ctg gaa cgt cga ttt acg tgc 
cys cys ala ser lys thr pro thr gin ala ala ser pro leu glu arg arg phe thr cys 
241/81 271/91 

tgc tec ccg gcc gtc gga tgc cga ttc cgc age ttc ccg gtg cga egg ctg gcg etc gga 
cys ser pro ala val gly cys arg phe arg ser phe pro val arg arg leu ala leu gly 
301/101 331/111 

gca egg aca teg aga act etc ggg gtt egg cga acg tta tct cag tgg aat etc agt cca 
ala arg thr ser arg thr leu gly val arg arg thr leu ser gin trp asn leu ser pro 
361/121 391/131 

cgc gcg caa cct agt tgt gca gtt act gtt gaa age cac acc cat gcc agt cca cgc atg 
arg ala gin pro ser cys ala val thr val glu ser his thr his ala ser pro arg met 
421/141 451/151 

gcc aag ttg gcc cga gta gtg ggc eta gta cag gaa gag caa cct age gac atg acg aat 
ala lys leu ala arg val val gly leu val gin glu glu gin pro ser asp met thr asn 
481/161 511/171 

cac cca egg tat teg cca ccg ccg cag cag ccg gga acc cca ggt tat get cag ggg cag 
his pro arg tyr ser pro pro pro gin glr> pro gly thr pro gly tyr ala gin gly gin 
541/181 571/191 

cag caa acg tac age cag cag ttc gac tgg cgt tac cca ccg tec ccg ccc ccg cag cca 
gin gin thr tyr ser gin gin phe asp trp arg tyr pro pro ser pro pro pro gin pro 
601/201 631/211 

acc cag tac cgt caa ccc tac gag gcg ttg ggt ggt acc egg ccg ggt ctg ata cct ggc 
thr gin tyr arg gin pro tyr glu ala leu gly gly thr arg pro gly leu ile oro gly 
661/221 691/231 

gtg att ccg acc atg acg ccc cct cct ggg atg gtt cgc caa cgc cct cgt gca ggc atg 
val ile pro thr met thr pro pro pro gly met val arg gin arg pro arg ala gly met 
721/241 751/251 

ttg gcc ate ggc gcg gtg acg ata gcg gtg gtg tec gcc ggc ate ggc ggc gcg gcc gca 
leu ala ile gly ala val thr ile ala val val ser ala gly ile gly gly ala ala ala 
781/261 811/271 

tec ctg gtc ggg ttc aac egg gca ccc gcc ggc ccc age ggc ggc cca gtg get gcc age 
ser leu val gly phe asn arg ala pro ala gly pro ser gly gly pro val ala ala ser 
841/281 871/291 

gcg gcg cca age ate ccc gca gca aac atg ccg ccg ggg teg gtc gaa cag gtg gcg gcc 
ala ala pro ser ile pro ala ala asn met pro pro gly ser val glu gin val ala ala 



SEQ ID N° 4 9F 



FIGURE 49F 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 




; CT/FR98/01813 



175/185 



901/301 

aag gtg gtg ccc agt gtc gtc atg ttg gaa 
lys vai vai pro ser vai vai met leu glu 
961/321 

tec ggc ate att ctg tct gcc. gag ggg ctg 
ser gly ile ile leu ser ala glu gly leu 
1021/341 

gcc gcc aag cct ccc ctg ggc agt ccg ccg 
ala ala lys pro pro leu gly ser pro pro 
1081/361 

egg acc gca ccc ttc acg gtg gtg ggg get 
arg thr ala pro phe thr vai vai gly ala 
1141/381 

gtt cag ggc gtc tec ggg etc acc ccg ate 
vai gin gly vai ser gly leu thr pro ile 
1201/401 

ggt cag ccg gtg ctg gcg ate ggg teg ccg 
gly gin pro vai leu ala ile gly ser pro 
1261/421 

ate gtc age get etc aac cgt cca gtg teg 
ile vai ser ala leu asn arg pro vai ser 
1321/441 

gtg ctg gac gcc att cag acc gac gcc gcg 
vai leu asp ala ile gin thr asp ala ala 
1381/461 

gtg aac atg aac get caa etc gtc gga gtc 
vai asn met. asn ala gin leu vai gly vai 
1441/481 

tea gcc gat , gcg cag age ggc teg ate ggt 
ser ala asp ala gin ser gly ser ile gly 
1501/501 

aag cgc ate gcc gac gag ttg ate age acc 
lys arg ile ala asp glu leu ile ser thr 
1561/521 

cag gtg acc aat gac aaa gac acc ctg ggc 
gin vai thr asn asp lys asp thr leu gly 
1621/541 

get gcc gcg aac get gga gtg ccg aag ggc 
ala ala ala asn ala gly vai pro lys gly 
1681/561 

ate aac age gcg gac gcg ttg gtt gcc gcc 
ile asn ser ala asp ala leu vai ala ala 
1741/581 

gcg eta acc ttt cag gat ccc teg ggc ggt 

ala leu thr phe gin asp pro ser gly gly 

1801/601 

gcg gag cag tga 

ala glu gin OPA 



931/311 














acc gat ctg ggc 
thr asp leu gly 
991/331 


cgc cag 
arg gin 


teg 
ser 


gag 
glu 


gag 
glu 


ggc 
gly 


ate ttg acc aac 
ile leu thr asn 
1051/351 


aac 
asn 


cac 
his 


gtg 
vai 


ate 
ile 


gcg 
ala 


gcg 
ala 


ccg aaa acg acg 
pro lys thr thr 
1111/371 


gta 
vai 


acc 
thr 


ttc 
phe 


tct 
ser 


gac 
asp 


ggg 

gly 


gac ccc acc agt 
asp pro thr ser 
1171/391 


gat 
asp 


ate 
ile 


gcc 
ala 


gtc 
vai 


gtc 
vai 


cgt 
arg 


tec ctg ggt tec 
ser leu gly ser 
1231/411 


tec 
ser 


teg 
ser 


gac 
asp 


ctg 
leu 


agg 
arg 


gtc 
vai 


etc ggt ttg gag 
leu gly leu glu 
1291/431 


ggc acc 
gly thr 


gtg 

vai 


acc 
thr 


acg 
thr 


ggg 
giy 


acg acc ggc gag 
thr thr gly glu 
1351/451 


gcc ggc 
ala gly 


aac 
asn 


cag 
gin 


aac 
asn 


acc 
thr 


ate aac ccc ggt 
ile asn pro gly 
1411/471 


aac 
asn 


tec 
ser 


ggg 

gly 


ggc 

giy 


gcg 
ala 


ctg 
leu 


aac teg gcc att 
asn ser ala ile 
1471/491 


gcc 
ala 


acg 
thr 


ctg 
leu 


ggc 
gly 


gcg 
ala 


gac 
asp 


etc ggt ttt gcg 
leu gly phe ala 
1531/511 


att 
ile 


cca 
pro 


gtc 
vai 


gac 
asp 


cag 
gin 


gcc 
ala 


ggc aag gcg tea 
gly lys ala ser 
1591/531 


cat 
his 


gcc 
ala 


tec 
ser 


ctg 
leu 


ggt 
gly 


gtg 
vai 


gcc aag ate gtc 
ala lys ile vai 
1651/551 


gaa gta 
glu vai 


gtg 
vai 


gcc 
ala 


ggt 
gly 


ggt 
gly 


gtc gtt gtc acc 
vai vai vai thr 
1711/571 


aag gtc 
lys vai 


gac 
asp 


gac 
asp 


cgc 
arg 


ccg 
pro 


gtg egg tec aaa 
vai arg ser lys 
1771/591 


gcg 
ala 


ccg 
pro 


ggc 
gly 


gcc 
ala 


acg 
thr 


gtg 
vai 


age cgc aca gtg 
ser arg thr vai 


caa gtc 
gin vai 


acc 
thr 


etc 
leu 


ggc 
gly 


aag 
lys 



SEQ ID N° 49F (suite 1) 
FIGURE 49F (suite 1) 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 PCT/FR98/01813 

176/185 

Fragment amplifie par PCR d'apres les similarities de sequence avec une serine protease de 
la famille HtrA de E. coli (creation du site SnaBI a l'extremite 3*) et sous clone dans 
le vecteur pJVEDa: 

1/1 31/11 

gat ccg gcg ggg egg gtg teg gcg cag gcg tgg ctg gcg gtc acg gcg gtg egg gcg gtg 
asp pro ala gly arg val ser ala gin ala trp leu ala val thr ala val arg ala val 
61/21 91/31 

ccg ccg ggc tgt ggg gcg ccg gcg gcg gcg gtg gca atg gcg gga acg gcg ccg atg cca 
pro pro gly cys gly ala pro ala ala ala val ala met ala gly thr ala pro met pro 
121/41 151/51 

aca teg tea gcg gtg gag acg gtg gec teg gcg gtg ccg gtg gcg gtg gcg gat ggc tct 
thr ser ser ala val glu thr val ala ser ala val pro val ala val ala asp gly ser 
181/61 211/71 

acg gcg acg gcg ggg ccg gcg gac acg gcg gac aag gcg caa teg gec teg gcg gcg gcg 
thr ala thr ala gly pro ala asp thr ala asp lys ala gin ser ala ser ala ala ala 
241/81 271/91 

ccg gcg gcg acg ggg gec agg gcg gcg ccg gec gcg gac tgt ggg gta ctg gcg gcg ccg 
pro ala ala thr gly ala arg ala ala pro ala ala asp cys gly val leu ala ala pro 
301/101 331/111 

gcg gac acg gcg ggc aag gcg gtg gta ccg ggg gec cac cgc tgc ccg gtc agg cag gca 
ala asp thr ala gly lys ala val val pro gly ala his arg cys pro val arg gin ala 
361/121 391/131 

tgg gcg ccg egg gtg gcg ccg gtg ggc tga teg gca acg gcg ggg ccg gcg gcg acg gcg 
trp ala pro arg val ala pro val gly OPA ser ala thr ala gly pro ala ala thr ala 
421/141 451/151 

gtg teg gcg cgt ccg gcg ggg teg ccg gag tag gcg gtg ccg gcg gga acg cca tgc tga 
val ser ala arg pro ala gly ser pro glu AMB ala val pro ala gly thr pro cys OPA 
481/161 511/171 

teg ggc acg gcg gcg ccg gcg gcg ccg gcg gag aca gca gtt teg eta atg gcg egg ccg 
ser gly thr ala ala pro ala ala pro ala glu thr ala val ser leu met ala arg pro 
541/181 571/191 

gcg gcg egg gcg gtg ccg gag ggc acc tct teg gca atg gcg ggt ccg gcg gee acg gcg 
ala ala arg ala val pro glu gly thr ser ser ala met ala gly pro ala ala thr ala 
601/201 631/211 

gag ccg tea egg ccg gca aca ccg gta teg gtg gcg ccg gcg gcg teg gtg ggg acg cca 
glu pro ser arg pro ala thr pro val ser val ala pro ala ala ser val gly thr pro 
661/221 691/231 

ggc tga teg gec acg gtg gcg ccg gcg gtg ccg gcg ggg acc gcg ccg gag cct tgg ttg 
gly OPA ser ala thr val ala pro ala val pro ala gly thr ala pro glu pro trp leu 
721/241 751/251 

gec gtg acg gcg ggc ccg gtg gga acg ggg gcg ctg gcg gec age tat acg gca acg gcg 
ala val thr ala gly pro val gly thr gly ala leu ala ala ser tyr thr ala thr ala 
781/261 811/271 

gcg acg gcg ccc ccg gca ccg gcg gaa cac tgc agg egg egg tga gcg gat tgg tga egg 
ala thr ala pro pro ala pro ala glu his cys arg arg arg OPA ala asp trp OPA arg 
841/281 871/291 

ctt tgt teg gtg cac ccg gec aac ccg gcg aca ccg gec aac ccg get age ccc gat caa 
leu cys ser val his pro ala asn pro ala thr pro ala asn pro ala ser pro asp gin 
901/301 931/311 

cga ggg ttt egg tgc egg tec ggg gca tgg cca tec get gag ctg gcg ate tgg act acg 
arg gly phe arg cys arg ser gly ala trp pro ser ala glu leu ala ile trp thr thr 
961/321 991/331 

ttg gtg tag aaa aat cct gee gec egg acc ctt aag get ggg aca att tct gat age tac 
leu val AMB lys asn pro ala ala arg thr leu lys ala gly thr ile ser asp ser tyr 
1021/341 1051/351 

ccc gac aca gga ggt tac ggg atg age aat teg cgc cgc cgc tea etc agg tgg tea tgg 
pro asp thr gly gly tyr gly met 3er asn ser arg arg arg ser leu arg tro ser trp 
1081/361 1111/371 

ttg ctg age gtg ctg get gec gtc ggg ctg ggc ctg gee acg gcg ccg gee cag gcg gec 
leu leu ser val leu ala ala val gly leu gly leu ala thr ala pro ala gin ala ala 
1141/381 

ccg ccg gec ttg teg cag gac egg tt 
pro pro ala leu ser gin asp arg 

SEQ ID N° 50A 



FEU1LLE DE REMPffg^jE^REGLE 26) 



WO 99/09186 



7FR98/01813 
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1/1 

ate egg egg ggc ggg 
ile arg arg gly gly 
61/21 

cgc egg get gtg ggg 
arg arg ala val gly 
121/41 

cat cgt cag egg tgg 
hi 3 arg gin arg trp 
181/61 

egg cga egg egg ggc 
arg arg arg arg gly 
241/81 

egg egg cga egg ggg 
arg arg arg arg gly 
301/101 

egg aca egg egg gca 
arg thr arg arg ala 
361/121 

ggg cgc cgc ggg tgg 
gly arg arg gly trp 
421/141 

tgt egg cgc gtc egg 
cys arg arg val arg 
481/161 

egg gca egg egg cgc 
arg ala arg arg arg 
541/181- 

egg cgc ggg egg tgc 
arg arg gly arg cys 
601/201 

age cgt cac ggc egg 
ser arg his gly arg 
661/221 

get gat egg cca egg 
ala asp arg pro arg 
721/241 

ccg tga egg egg gec 
pro OPA arg arg ala 
781/261 

cga egg cgc ccc egg 
arg arg arg pro arg 
841/281 

ttt gtt egg tgc acc 
phe val arg cys thr 
901/301 

gag ggt ttc ggt gec 
glu gly phe gly ala 
961/321 

tgg tgt aga aaa ate 
trp cys arg lys ile 
1021/341 

ccg aca cag gag* gtt 
pro thr gin glu val 
1081/361 

tgc tga gcg tgc tgg 
cys OPA ala cys trp 
1141/381 

cgc egg cct tgt cgc 
arg arg pro cys arg 



tgt 
cys 


egg 
arg 


cgc agg cgt 
arg arg arg 


cgc 
arg 


egg 
arg 


egg egg egg 
arg arg arg 


aga 
arg 


egg 
arg 


tgg cct egg 
trp pro arg 


egg 
arg 


egg 
arg 


aca egg egg 
thr arg arg 


cca 
pro 


ggg 
gly 


egg cgc egg 
arg arg arg 


agg 
arg 


egg 
arg 


tgg tac egg 
trp tyr arg 


cgc 
arg 


egg 
arg 


tgg get gat 
trp ala asp 


egg 
arg 


ggt 

gly 


cgc egg agt 
arg arg ser 


egg 
arg 


egg 
arg 


cgc egg egg 
arg arg arg 


egg 
arg 


agg 
arg 


gca cct ctt 
ala pro leu 


caa 
gin 


cac 
his 


egg tat egg 
arg tyr arg 


tgg 
trp 


cgc 
arg 


egg egg tgc 
arg arg cys 


egg 
arg 


tgg 
trp 


gaa egg ggg 
glu arg gly 


cac 
his 


egg 
arg 


egg aac act 
arg asn thr 


egg 
arg 


cca 
pro 


acc egg cga 
thr arg arg 


ggt 
gly 


ccg 
pro 


ggg cat ggc 
gly his gly 


ctg 
leu 


ccg 
pro 


ccc gga ccc 
pro gly pro 


acg 
thr 


gga 
gly 


tga gca att 
OPA ala ile 


ctg 
leu 


ccg 
pro 


teg ggc tgg 
ser gly trp 


agg 
arg 


acc 
thr 


ggt t 
gly 



31/11 

ggc tgg egg tea egg 
gly trp arg ser arg 
91/31 

tgg caa tgg egg gaa 
trp gin trp arg glu 
151/51 

egg tgc egg tgg egg 
arg cys arg trp arg 
211/71 

aca agg cgc aat egg 
thr arg arg a3n arg 
271/91 

ccg egg act gtg ggg 
pro arg thr val gly 
331/111 

ggg ccc acc get gec 
gly pro thr ala ala 
391/131 

egg caa egg egg ggc 
arg gin arg arg gly 
451/151 

agg egg tgc egg egg 
arg arg cys arg arg 
511/171 

aga cag cag ttt cgc 
arg gin gin phe arg 
571/191 

egg caa tgg egg gtc 
arg gin trp arg val 
631/211 

tgg cgc egg egg cgt 
trp arg arg arg arg 
691/231 

egg egg gga ccg cgc 
arg arg gly pro arg 
751/251 

cgc tgg egg cca get 
arg trp arg pro ala 
811/271 

gca ggc ggc ggt gag 
ala gly gly gly glu 
871/291 

cac egg cca acc egg 
his arg pro thr arg 
931/311 

cat ccg ctg age tgg 
his pro leu ser trp 
991/331 

tta agg ctg gga caa 
leu arg leu gly gin 
1051/351 

cgc gec gee get cac 
arg ala ala ala his 
1111/371 

gee tgg cca egg cgc 
ala trp pro arg arg 



egg 
arg 


tgc ggg 
cvs crlv 


egg 
arg 


tgc 


egg 
arq 


cgc cga 
arg arg 


tgc 


caa 
gin 


tgg 
trD 


egg atg 

arc met 


get 
ala 


eta 


cct 
pro 


egg egg 
arg arg 


egg 
<11 y 


cgc 
arg 


tac 
tvr 


tgg egg 
trp arg 


cgc 
arg 


egg 
arg 


egg 
arg 


tea ggc 
ser alv 


agg 
arg 


cat 
his 


egg 
arc 


egg cga 
arc aro 


egg 
arg 


egg 
arg 


gaa 
glu 


cgc cat 
arg his 


get 
ala 


gat 


taa 
OCH 


tgg cgc 
trp arg 


ggc 


egg 

a Tct 
«ig 


egg 
arc 


egg cca 
aro nro 


egg 
arg 


egg 
arg 


egg 
arc 


tgg gga 
trD olv 


cgc 
arg 


cag 
gin 


egg 
arg 


age ctt 
ser leu 


ggt 

gly 


tgg 
trp 


ata 
ile 


egg caa 
arc oln 


egg 
aro 


egg 
ara 


egg 
arg 


att ggt 
ile gly 


gac 
asp 


ggc 
gly 


eta 
leu 


gec ccg 
ala pro 


ate 
ile 


aac 
asn 


cga 
arg 


tct gga 
ser gly 


eta 
leu 


cgt 
arg 


ttt 
phe 


ctg ata 
leu ile 


get 
ala 


acc 
thr 


tea 
ser 


ggt ggt 
gly gly 


cat 
his 


ggt 

gly 


egg 
arg 


ccc agg 
pro arg 


egg 
arg 


ccc 
pro 
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1/1 31/11 

tec ggc ggg gcg ggt gtc ggc gca ggc gtg get ggc ggt cac ggc ggt gcg ggc ggt gee 
ser gly gly ala gly val gly ala gly val ala gly gly his gly gly ala gly gly ala 
61/21 91/31 

gec ggg ctg tgg ggc gec ggc ggc ggc ggt ggc aat ggc ggg aac ggc gec gat gec aac 
ala gly leu trp gly ala gly gly gly gly gly asn gly gly asn gly ala asp ala asn 
121/41 151/51 

ate gtc age ggt gga gac ggt ggc etc ggc ggt gec ggt ggc ggt ggc gga tgg etc tac 
ile val ser gly gly asp gly gly leu gly gly ala gly gly gly gly gly trp leu tyr 
181/61 211/71 

ggc gac ggc ggg gee ggc gga cac ggc gga caa ggc gca ate ggc etc ggc ggc ggc gee 
gly asp gly gly ala gly gly his gly gly gin gly ala ile gly leu gly gly gly ala 
241/81 271/91 

ggc ggc gac ggg ggc cag ggc ggc gee ggc cgc gga ctg tgg ggt act ggc ggc gee ggc 
gly gly asp gly gly gin gly gly ala gly arg gly leu trp gly thr gly gly ala gly 
301/101 331/111 

gga cac ggc ggg caa ggc ggt ggt acc ggg ggc cca ccg ctg ccc ggt cag gca ggc atg 
gly his gly gly gin gly gly gly thr gly gly pro pro leu pro gly gin ala gly met 
361/121 391/131 

ggc gee gcg ggt ggc gec ggt ggg ctg ate ggc aac ggc ggg gec ggc ggc gac ggc ggt 
gly ala ala gly gly ala gly gly leu ile gly asn gly gly ala gly gly asp gly gly 
421/141 451/151 

gtc ggc gcg tec ggc ggg gtc gec gga gta ggc ggt gee ggc ggg aac gec atg ctg ate 
val gly ala ser gly gly val ala gly val gly gly ala gly gly asn ala met leu ile 
481/161 511/171 

ggg cac ggc ggc gee ggc ggc gec ggc gga gac age agt ttc get aat ggc gcg gee ggc 
gly his gly gly ala gly gly ala gly gly asp ser ser phe ala asn gly ala ala gly 
541/181 S71/191 

ggc gcg ggc ggt gee gga ggg cac etc ttc ggc aat ggc ggg tec ggc ggc cac ggc gga 
gly ala gly gly ala gly gly his leu phe gly asn gly gly ser gly gly his gly gly 
601/201 631/211 

gee gtc acg gec ggc aac acc ggt ate ggt ggc gec ggc ggc gtc ggt ggg gac gec agg 
ala val thr ala gly asn thr gly ile gly gly ala gly gly val gly gly asp ala arg 
661/221 691/231 

ctg ate ggc cac ggt ggc gee ggc ggt gee ggc ggg gac cgc gec gga gee ttg gtt ggc 
leu ile gly his gly gly ala gly gly ala gly gly asp arg ala gly ala leu val gly 
721/241 751/251 

cgt gac ggc ggg ccc ggt ggg aac ggg ggc get ggc ggc cag eta tac ggc aac ggc ggc 
arg asp gly gly pro gly gly asn gly gly ala gly gly gin leu tyr gly asn gly gly 
781/261 8U/271 

gac ggc gee ccc ggc acc ggc gga aca ctg cag gcg gcg gtg age gga ttg gtg acg get 
asp gly ala pro gly thr gly gly thr leu gin ala ala val ser gly leu val thr ala 
841/281 871/291 

ttg ttc ggt gca ccc ggc caa ccc ggc gac acc ggc caa ccc ggc tag ccc cga tea acg 
leu phe gly ala pro gly gin pro gly asp thr gly gin pro gly AMB pro arg ser thr 
901/301 931/311 

agg gtt teg gtg ccg gtc egg ggc atg gee ate cgc tga get ggc gat ctg gac tac gtt 
arg val ser val pro val arg gly met ala ile arg OPA ala gly asp leu asp tyr val 
961/321 991/331 

ggt gta gaa aaa tec tgc cgc ccg gac cct taa ggc tgg gac aat ttc tga tag eta ccc 
gly val glu lys ser cys arg pro asp pro OCH gly trp asp asn phe OPA AMB leu pro 
1021/341 1051/351 

cga cac agg agg tta egg gat gag caa ttc gcg ccg ccg etc act cag gtg gtc atg gtt 
arg his arg arg leu arg asp glu gin phe ala pro pro leu thr gin val val met val 
1081/361 1111/371 

get gag cgt get ggc tgc cgt egg get ggg cct ggc cac ggc gec ggc cca ggc ggc ccc 
ala glu arg ala gly cys arg arg ala gly pro gly his gly ala gly pro gly gly pro 
1141/381 

gee ggc ctt gtc gca gga ccg gtt 
ala gly leu val ala gly pro val 



SEQ ID N° 50C 



FIGURE 50C 
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179/185 

Sequence codante Rv0125 predite par Cole et al., 1996 (Nature 393:537-544) et 
contenant seq50A: 

1/1 31/11 

tgg tea 
trp ser 
91/31 
cag gcg 
gin ala 
151/51 
gac ccg 
asp pro 
211/71 
ggc tac 
gly tyr 
271/91 
ctg acc 
leu thr 
331/111 
ggc caa 
gly gin 
391/131 
cag ctg 
gin leu 
451/151 
gag ccc 
glu pro 
511/171 
ggc agg 
gly arg 
571/191 
gag aca 
glu thr 
631/211 
ccc gtc 
pro val 
691/231 
cag ctg 
gin leu 
751/251 
ggc cag 
gly gin 
811/271 
ggc ttg 
gly leu 
871/291 
get ccg 
ala pro 
931/311 
ccg ate 
pro ile 
991/331 
ate teg 
ile ser 
1051/351 
gag gga 
glu gly 

SEQ ID N° 50D 
FEUILLE DE REMPtt/SOEBBEKTD(REGLE 26) 



atg age 
Met ser 
61/21 


aat 
asn 


teg 
ser 


cgc 
arg 


cgc 
arg 


cgc 
arg 


tea 
ser 


etc 
leu 


agg 
arg 


gtc ggg 
val gly 
121/41 


ctg 
leu 


ggc 
gly 


ctg 
leu 


gee 
ala 


acg 
thr 


gcg 
ala 


ccg 
pro 


gee 
ala 


egg ttc 
arg phe 
181/61 


gec 
ala 


gac 
asp 


ttc 
phe 


ccc 
pro 


gcg 
ala 


ctg 
leu 


ccc 
pro 


etc 
leu 


cca cag 
pro gin 
241/81 


gtg 
val 


gtc 
val 


aac 
asn 


ate 
ile 


aac 
asn 


acc 
thr 


aaa 
lys 


ctg 
leu 


ggc ate 
gly ile 
301/101 


gtc 
val 


ate 
ile 


gat 
asp 


ccc 
pro 


aac 
asn 


ggt 
gly 


gtc 
val 


gtg 
val 


acc gac 
thr asp 
361/121 


ate 
ile 


aat 
asn 


gcg 
ala 


ttc 
phe 


age 
ser 


gtc 
val 


ggc 
gly 


tec 
ser 


tat gac 
tyr asp 
421/141 


cgc 
arg 


acc 
thr 


cag 
gin 


gat 
asp 


gtc 
val 


gcg 
ala 


gtg 
val 


ctg 
leu 


gcg gcg 
ala ala 
481/161 


ate 
ile 


ggt 
gly 


ggc 
gly 


ggc gtc 
gly val 


gcg 
ala 


gtt 
val 


ggt 
gly 


ggg cag 
gly gin 
541/181 


ggc 
gly 


gga 
gly 


acg 
thr 


ccc 
pro 


cgt 
arg 


gcg 
ala 


gtg 
val 


cct 
pro 


cag gcg 
gin ala 
601/201 


teg 
ser 


gat 
asp 


teg 
ser 


ctg 
leu 


acc 
thr 


ggt 
gly 


gee 
ala 


gaa 
glu 


gec gcg 
ala ala 
661/221 


ate 
ile 


cag 
gin 


ccc 
pro 


ggt gat 
gly asp 


teg 
ser 


ggc 
gly 


ggg 

gly 


ggt atg 
gly met 
721/241 


aac 
asn 


acg 
thr 


gec 
ala 


gcg 
ala 


tec 
ser 


gat 
asp 


aac 
asn 


ttc 
phe 


att ccg 
ile pro 
781/261 


ate 
ile 


ggg 

gly 


cag 
gin 


gcg 
ala 


atg 
met 


gcg 
ala 


ate 
ile 


gcg 
ala 


acc gtt 
thr val 
841/281 


cat 
his 


ate 
ile 


ggg 

gly 


cct 
pro 


acc 
thr 


gee 
ala 


ttc 
phe 


etc 
leu 


ggc gca 
gly ala 
901/301 


cga 
arg 


gtc 
val 


caa 
gin 


cgc 
arg 


gtg 
val 


gtc 
val 


ggg 

gly 


age 
ser 


ggc gac 
gly asp 
961/321 


gtg 
val 


ate 
ile 


acc 
thr 


gcg 
ala 


gtc 
val 


gac 
asp 


ggc 
gly 


get 
ala 


gcg ctt aac 
ala leu asn 
1021/341 


ggg 

gly 


cat 
his 


cat 
his 


ccc 
pro 


ggt 
gly 


gac 
asp 


gtc 
val 


ggc acg 
gly thr 


cgt 
arg 


aca 
thr 


ggg 

gly 


aac 
asn 


gtg 
val 


aca 
thr 


ttg 
leu 


gee 
ala 



tgg 
trp 


ttg 
leu 


ctg 
leu 


age 
ser 


gtg 
val 


ctg 
leu 


get 
ala 


gee 
ala 


gec 
ala 


ccg 
pro 


ccg 
pro 


gec 
ala 


ttg 
leu 


teg 
ser 


cag 
gin 


gac 
asp 


tec 
ser 


gcg 
ala 


atg 
met 


gtc 
val 


gec 
ala 


caa 
gin 


gtg 
val 


ggg 

gly 


aac 
asn 


aac 
asn 


gec 
ala 


gtg 
val 


ggc 
gly 


gec 
ala 


ggg 

gly 


acc 
thr 


aac 
asn 


aac 
asn 


cac 
his 


gtg 
val 


ate 
ile 


gcg 
ala 


ggc 
gly 


gee 
ala 


acc 
thr 


tac 
tyr 


ggc 
gly 


gtc 
val 


gat 
asp 


gtg 
val 


gtc 
val 


ggg 

gly 


cgc 
arg 


ggt 

gly 


gec 
ala 


ggt 
gly 


ggc 
gly 


ctg 
leu 


ccg 
pro 


teg 
ser 


gtc 
val 


gtc 
val 


gcg 
ala 


atg 
met 


ggc 
gly 


aac 
asn 


age 
ser 


ggt 

gly 


gtg 
val 


gtc 
val 


gcg 
ala 


etc 
leu 


ggc 
gly 


caa 
gin 


acc 
thr 


gtg 
val 


ttg 
leu 


aac 
asn 


ggg 

gly 


ttg 
leu 


ate 
ile 


cag 
gin 


ttc 
phe 


gat 
asp 


gtc 
val 


aac 
asn 


ggc 
gly 


eta 
leu 


gga 
gly 


cag 
gin 


gtg 
val 


gtc 
val 


tec 
ser 


cag 
gin 


ggt 
gly 


ggg 

gly 


cag 
gin 


gga 
gly 


ttc 
phe 


gee 
ala 


ate 
ile 


cga 
arg 


teg 
ser 


ggt 
gly 


ggg 

gly 


ggg 

gly 


tea 
ser 


ccc 
pro 


ggt 
gly 


gtt 
val 


gtc 
val 


gac 
asp 


aac 
asn 


aac 
asn 


ggc 
gly 


aac 
asn 


gcg 
ala 


gca 
ala 


agt 
ser 


etc 
leu 


ggc 
gly 


ate 
ile 


tec 
ser 


acc 
thr 


aac 
asn 


teg 
ser 


gee 
ala 


acc 
thr 


gcg 
ala 


atg 
met 


gcg 
ala 


gac 
asp 


gtg 
val 


acc 
thr 


tgg 
trp 


caa 
gin 


acc 
thr 


aag 
lys 


teg 
ser 


ggc 
gly 


ccc 
pro 


ccg 
pro 


gee 
ala 


tga 
OPA 
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ORF d'apres Cole et al., 1998 (Nature 393:537-544) et contenant Rv0125: 
1/1 31/11 

tag aaa aat cct gcc gcc egg acc ctt aag get ggg aca att tct gat age tac ccc gac 
AMB lys asn pro ala ala arg thr leu lys ala gly thr ile ser asp ser tyr pro asp 
61/21 91/31 

aca gga ggt tac ggg atg age aat teg cgc cgc cgc tea etc agg tgg tea tgg ttg ctg 
thr gly gly tyr gly met ser asn ser arg arg arg ser leu arg trp ser trp leu leu 
121/41 151/51 

age gtg ctg get gcc gtc ggg ctg ggc ctg gcc acg gcg ccg gcc cag gcg gcc ccg ccg 
ser val leu ala ala val gly leu gly leu ala thr ala pro ala gin ala ala pro pro 
181/61 211/71 

gcc ttg teg cag gac egg ttc gcc gac ttc ccc gcg ctg ccc etc gac ccg tec gcg atg 
ala leu ser gin asp arg phe ala asp phe pro ala leu pro leu asp pro ser ala met 
241/81 271/91 

gtc gcc caa gtg ggg cca cag gtg gtc aac ate aac acc aaa ctg ggc tac aac aac gcc 
val ala gin val gly pro gin val val asn ile asn thr lys leu gly tyr asn asn ala 
301/101 331/111 

gtg ggc gcc ggg acc ggc ate gtc ate gat ccc aac ggt gtc gtg ctg acc aac aac cac 
val gly ala gly thr gly ile val ile asp pro asn gly val val leu thr asn asn his 
361/121 391/131 

gtg ate gcg ggc gcc acc gac ate aat gcg ttc age gtc ggc tec ggc caa acc tac ggc 
val ile ala gly ala thr asp ile asn ala phe ser val gly ser gly gin thr tyr gly 
421/141 451/151 

gtc gat gtg gtc ggg tat gac cgc acc cag gat gtc gcg gtg ctg -cag ctg cgc ggt gcc 
val asp val val gly tyr asp arg thr gin asp val ala val leu gin leu arg gly ala 
481/161 511/171 

ggt ggc ctg ccg teg gcg gcg ate ggt ggc ggc gtc gcg gtt ggt gag ccc gtc gtc gcg 
gly gly leu pro ser ala ala ile gly gly gly val ala val gly glu pro val val ala 
541/181 571/191 

atg ggc aac age ggt ggg cag ggc gga acg ccc cgt gcg gtg cct ggc agg gtg gtc gcg 
met gly asn ser gly gly gin gly gly thr pro arg ala val pro gly arg val val ala 
601/201 631/211 

etc ggc caa acc gtg cag gcg teg gat teg ctg acc ggt gcc gaa gag aca ttg aac ggg 
leu gly gin thr val gin ala ser asp ser leu thr gly ala glu glu thr leu asn gly 
661/221 691/231 

ttg ate cag ttc gat gcc gcg ate cag ccc ggt gat teg ggc ggg ccc gtc gtc aac ggc 
leu ile gin phe asp ala ala ile gin pro gly asp ser gly gly pro val val asn gly 
721/241 751/251 

eta gga cag gtg gtc ggt atg aac acg gcc gcg tec gat aac ttc cag ctg tec cag ggt 
leu gly gin val val gly met asn thr ala ala ser asp asn phe gin leu ser gin gly 
781/261 811/271 

ggg cag gga ttc gcc att ccg ate ggg cag gcg atg gcg ate gcg ggc cag ate cga teg 
gly gin gly phe ala ile pro ile gly gin ala met ala ile ala gly gin ile arg ser 
841/281 871/291 

ggt ggg ggg tea ccc acc gtt cat ate ggg cct acc gcc ttc etc ggc ttg ggt gtt gtc 
gly gly gly ser pro thr val his ile gly pro thr ala phe leu gly leu gly val val 
901/301 931/311 

gac aac aac ggc aac ggc gca cga gtc caa cgc gtg gtc ggg age get ccg gcg gca agt 
asp asn asn gly asn gly ala arg val gin arg val val gly ser ala pro ala ala ser 
961/321 991/331 

etc ggc ate tec acc ggc gac gtg ate acc gcg gtc gac ggc get ccg ate aac teg gcc 
leu gly ile ser thr gly asp val ile thr ala val asp gly ala pro ile asn ser ala 
1021/341 1051/351 

acc gcg atg gcg gac gcg ctt aac ggg cat cat ccc ggt gac gtc ate Ccg gtg acc tgg 
thr ala met ala asp ala leu asn gly his his pro gly asp val ile ser val thr trp 
1081/361 1111/371 

caa acc aag teg ggc ggc acg cgt aca ggg aac gtg aca ttg gcc gag gga ccc ccg gcc 

gin thr lys ser gly gly thr arg thr gly asn val thr leu ala glu gly pro pro ala 

1141/381 

tga 

OPA 
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Experiences d T hybridation molfeculaire d'une sonde spScifique 
du DP428 sur l 1 ADN g&nomique de diffSrentes espdces de 
mycobactferies 



1 2 3 4 56 7 8 9 10111213 




1: M. tuberculo3i3 2: M. Jbovia 3: BCG 4: M. africanum 5; cancelled 6: M. 
fortuitum 7: M. simiae 8: M. avium 9: W. chelonae 10: M. flavescens 11: M. 
gordonae 12: M. marinum 13: M. kansasii 
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